Đang code dở thì lướt X (Twitter) thấy dân tình rần rần vụ cái tên lửa của lão Jeff Bezos nổ banh xác. Anh em ạ, dev mình bug code thì cùng lắm sập máy chủ, xách đít lên rollback lại bản cũ là xong, chứ mấy pháp sư hàng không vũ trụ mà dính bug thì nó nổ thành pháo hoa chục củ đô rực sáng cả một góc trời luôn.
Toang thật rồi giáo chủ Jeff ơi! Chuyện quái gì vừa xảy ra?
Cho các ông nào lười lướt tin tiếng Anh, thì tóm tắt nhanh nó là thế này:
- Nạn nhân: Tên lửa New Glenn của công ty Blue Origin (vâng, công ty của sếp bự Amazon).
- Sự kiện: Đang làm cái trò gọi là "static fire test" (đốt động cơ nhưng giữ tên lửa đứng yên trên bệ phóng để đo đạc data).
- Kết quả: Thay vì gầm rú ngầu lòi như phim viễn tưởng, phần dưới của con tàu bùm một phát. Lửa khói mịt mù, một phần cứng của tên lửa coi như chầu ông bà.
- Hậu quả: Blue Origin trước giờ nổi tiếng là "chậm mà chắc", delay liên tọi. Quả nổ này xác suất cao là sẽ khiến dự án tiếp tục đắp chiếu thêm một thời gian kha khá nữa. Quả timeline ra mắt năm nay coi như... cút.
Giang cư mận nói gì khi thấy pháo hoa sớm?
Mặc dù bài gốc không có comment, nhưng anh em lượn một vòng Reddit với X thì cộng đồng công nghệ đang chia phe combat khá xôm:
- Phe khịa (chủ yếu là fan SpaceX): "Lại delay đến mùa quýt", "Deploy vào chiều thứ Sáu và cái kết", "Slogan của Blue Origin là Gradatim Ferociter (Từng bước quyết liệt), nhưng mà bước này hơi... lùi quá".
- Phe đồng cảm (Team hiểu chuyện): "Hardware is hard" (Làm phần cứng chua lắm). Mấy lão quái trong ngành thì bình tĩnh phân tích: SpaceX ngày xưa nổ không biết bao nhiêu cái Starship mới có ngày hôm nay. Thà nổ ở bệ test (môi trường staging) còn hơn là nổ lúc chở hàng thật (lên production).
Góc nhìn từ Coding4Food: Bài học sinh tồn sau vụ nổ
Chém gió vui vậy thôi, chứ nhìn qua lăng kính của anh em thợ code tụi mình, vụ này có đầy bài học thực dụng:
- Staging sinh ra là để sập: Mục đích của test không phải là để chứng minh mọi thứ hoàn hảo, mà là để tìm ra điểm chết của hệ thống trước khi nó được đưa vào vận hành thật. Tên lửa nổ lúc test tĩnh là đau đấy, nhưng nó chứng minh quy trình test đang hoạt động. Code anh em crash ở môi trường Dev/Staging thì nên mừng chứ đừng quạo.
- Log, Log và Log: Sau vụ nổ này, Blue Origin chắc chắn sẽ thu về hàng Terabyte dữ liệu telemetry (các thông số cảm biến). Thất bại chỉ vô dụng khi các ông đ*o biết vì sao nó thất bại. Vậy nên, anh em viết API hay microservices thì nhớ nhét logging/monitoring vào cho đàng hoàng. Sập server mà không có log thì chả khác gì thầy bói xem voi.
- Đừng sợ đập đi làm lại: Tài nguyên của Bezos là vô hạn, nhưng thời gian thì không. Vấn đề là họ dám thử. Anh em mình code một cái feature, refactor bị lỗi, bể layout, thì cứ coi như đang test tên lửa đi. Sửa lại cho mượt là được.
Chốt hạ, chúc Blue Origin sớm fix được con bug vật lý cắn RAM này. Còn anh em mình, thứ Sáu rồi, hạn chế deploy nhé, không lại nổ như New Glenn thì cuối tuần mất vui!
Nguồn: