Tàu Artemis II của NASA vừa hạ cánh an toàn. Cùng mổ xẻ xem dân IT nói gì về pha deploy không được phép có bug này và bài học xương máu cho anh em dev.

Dạo này anh em lướt X (Twitter) hay Hacker News (HN) thì chắc cũng thấy tin: Artemis II vừa hạ cánh an toàn đánh cái rầm xuống biển. Hơn 800 upvote trên HN, một con số đủ để biết độ hot của sự kiện. Anh em dev chúng ta nhìn vào chỉ thấy một sự thật: Project tỷ đô của NASA cuối cùng cũng pass QC để deploy lên production thành công mà đ*o có bug nào chí mạng!
Chuyện là con tàu Orion thuộc sứ mệnh Artemis II vừa hoàn thành chuyến dạo chơi quanh Mặt Trăng và đâm xuyên qua bầu khí quyển để đáp xuống Thái Bình Dương an toàn. Khác với Artemis I chỉ bay cho vui, lần này trên tàu có người thật việc thật các ông ạ. Bốn phi hành gia đã bình an vô sự.
Nói theo ngôn ngữ của anh em mình, thì NASA vừa push một cục code khổng lồ, điều khiển hàng triệu con sensor, tính toán quỹ đạo, kiểm soát nhiệt độ... lên một con server xa tít mù tắp. Và ơn giời, nó chạy mượt! Không sập server, không có quả hotfix nào phải tung ra giữa không gian. Tàu vớt lên, người còn sống, project chuyển trạng thái "Done".
Dù bài gốc trên HN đ*o có nhiều comment lúc mới lên, nhưng thân là một senior hay nằm vùng, tôi thừa biết mấy "lão quái" trên đấy đang xì xào cái gì. Có mấy luồng dư luận thế này:
Tóm cái váy lại, nhìn NASA thành công, anh em dev mình cũng rút ra được mớ kinh nghiệm.
Khi anh em làm mấy cái app CRUD, web bán hàng tàng tàng, lỗi thì fix, cùng lắm là nghe sếp chửi. Nhưng khi làm các system critical liên quan đến y tế, tài chính, hay mạng người, thì hãy dẹp mẹ cái tư duy "cứ deploy lên môi trường production chạy thử con máy chủ xem sao, có lỗi thì roll back" đi nhé. Khách hàng không phải là tester miễn phí cho các ông.
Test cho kỹ, viết unit test cho đàng hoàng. Làm IT đã rụng tóc rồi, đừng để đêm ngủ thót tim vì sợ con bug cắn RAM gọi dậy lúc 2h sáng.
Nguồn hóng hớt: