Câu chuyện cười ra nước mắt của một thanh niên tự hủy 2 ổ cứng 14TB lúc 2h sáng. Bài học xương máu cho anh em dev đam mê chọc ngoáy homelab đêm khuya.

Đêm hôm khuya khoắt ngứa tay lại hay hỏng việc các ông ạ. Câu chuyện của một thanh niên tự hủy 2 ổ cứng 14TB chỉ vì một phút "ảo ma" lúc 2 giờ sáng đang khiến cộng đồng Reddit cười ra nước mắt.
Tóm tắt nhanh cho anh em lười đọc: Chủ thớt hốt được 2 con HDD 14TB recertified (hàng tân trang) với giá khá hời, 230 đô Úc/củ để lưu trữ "ISO Linux" (anh em dev tự hiểu là tài liệu gì rồi đấy). Mọi thứ đang chạy mượt mà, không một lỗi lầm.
Cho đến một đêm 2h sáng, ngứa tay hyperfixate thế quái nào lại đi dời cái máy chủ trong khi nó vẫn đang cắm điện chạy phà phà.
Kết quả? Lỗi data văng tung tóe ngay lập tức. Cay đắng nhất là khi check lại giá, một con ổ tương đương từ cùng người bán giờ đã bị thổi giá lên 620 AUD (tăng gấp 2.7 lần). Toang thực sự!
Bài post hú lên cái là 500 anh em thợ máy vào bắt mạch ngay. Đa phần các đồng đạo đều chia ra các luồng suy nghĩ sau:
smartctl: Chủ thớt tự check log thì thấy một ổ dính reallocated sectors (cái này thì hơi căng), nhưng ổ kia chỉ báo 1 lỗi UDMA CRC Error. Anh em đều biết lỗi CRC thì 99% là do cáp dỏm hoặc cắm lỏng.Thứ nhất, nguyên tắc xương máu: Đừng bao giờ động vào phần cứng khi máy đang chạy. Đĩa từ HDD (spinning rust) nó quay 7200 vòng/phút, các ông bê lắc một cái là đầu đọc cày nát bét mặt đĩa. Tắt nguồn đi rồi hẵng làm gì thì làm.
Thứ hai, Troubleshooting 101: Đừng vội vứt đồ hay hoảng loạn mua mới. Tắt máy, rút cáp ra cắm lại thật chặt, check lại dây nguồn. Rất nhiều ca tưởng "chết ổ" nhưng thực ra chỉ là "chết cáp".
Chốt hạ: Đêm khuya mệt mỏi thì lo đi ngủ hoặc lướt top top ngắm gái, đừng có lôi server ra chọc ngoáy. Tay nhanh hơn não lúc 2 giờ sáng kiểu gì cũng phải trả giá bằng tiền mặt các ông ạ!
Nguồn tham khảo: Reddit