Chưa kịp để đối thủ OpenAI gáy xong mấy con o1, o3 mới tinh, Anthropic đã âm thầm quăng một quả bom hạng nặng mang tên Claude Fable 5 (Mythos-5) thẳng vào mặt giới công nghệ. Quả bom này ngay lập tức giật sương sương hơn 2100 điểm trên Hacker News, khiến anh em dev thức đêm hóng drama muốn nổ não.
Để xem con hàng này thực sự bá đạo, xịn xò con bò như lời đồn, hay lại là một cú quay xe lùa gà bằng điểm benchmark ảo ma.
Rốt cuộc thì chuyện quái gì vừa xảy ra?
Dành cho các đồng đạo lười đọc cái file System Card PDF dài dằng dặc của Anthropic, dưới đây là tóm tắt nhanh những điểm đáng chú ý nhất về Claude Fable 5:
- Điểm số benchmark hủy diệt: Anthropic tự tin tuyên bố con hàng này đè bẹp tất cả các model hiện tại trong việc giải quyết các task code phức tạp và suy luận logic đa bước.
- Khả năng tự fix bug cực dị: Theo báo cáo, Fable 5 có thể tự tìm ra các lỗ hổng bảo mật và tung ra hotfix tự động mà không cần dev can thiệp sâu. Nghe cứ như phim viễn tưởng nhưng họ cam đoan là thật.
- Tư duy "ma giáo" tự tối ưu: Nó không chỉ hiểu prompt mà còn tự biết "xoay" prompt theo nhiều hướng khác nhau để ra kết quả tối ưu nhất. Đúng kiểu tự làm tự ăn không phiền đến chủ.
- Cắn RAM khủng khiếp: Đương nhiên, để chạy mượt mấy tác vụ khủng khiếp này thì tài nguyên phần cứng không phải dạng vừa. Anh em nào có ý định tự host con này trên máy chủ riêng thì chắc phải sắm dàn vultr hàng khủng chứ VPS cỏ chịu sao thấu.
Giang cư mận Reddit và Hacker News nói gì?
Ngay sau khi tài liệu được tung ra, cộng đồng mạng lập tức chia phe combat cực gắt, chia làm hai luồng ý kiến rõ rệt:
- Phe cuồng giáo AGI: "Lạy các vị trưởng lão, đây chính là bình minh của AGI thực sự rồi! Quả này thì mấy anh em dev dạo chuẩn bị tinh thần chuyển sang làm thợ sửa ống nước hoặc đi bán trà đá là vừa."
- Phe hoài nghi thực dụng (gồm tôi và đa số lão quái lâu năm): "Thôi bớt bớt giùm! Mấy cái benchmark này xưa giờ toàn do các ông lớn tự đá bóng tự thổi còi. Con GPT-4 ngày xưa lúc mới ra mắt quảng cáo cũng kinh lắm, xong thực tế chạy dự án thực tế thì bug lòi mắt, cãi nhem nhẻm với khách hàng. Cứ phải đợi hàng về tay gõ thử vài bug thực tế xem có bể hay không rồi mới tin."
- Phe lo sợ về giá: Nhiều dev bày tỏ sự quan ngại sâu sắc về chi phí API. Một lần call API suy luận của Fable 5 chắc đi tong nửa ngày lương bèo bọt của tôi chứ chẳng đùa.
Góc nhìn từ Coding4Food
Túm cái váy lại, Claude Fable 5 có xịn xò đến mấy thì nó vẫn chỉ là một công cụ AI hỗ trợ đắc lực cho chúng ta mà thôi. Đừng quá hoang mang lo sợ bị cướp mất cần câu cơm. Tư duy thực dụng của một dev từng trải là: cái gì mới ra mà ngon thì cứ tranh thủ tận dụng để code nhanh hơn, lùa client tốt hơn, rảnh tay thì đi cà phê hóng drama tiếp.
Bài học xương máu sau vụ này là đừng bao giờ tin 100% vào những cái System Card bóng bẩy của các ông lớn công nghệ. Hãy luôn giữ một cái đầu lạnh, biết đặt câu hỏi hoài nghi và tập trung nâng cao tư duy giải quyết vấn đề của bản thân - thứ mà AI còn lâu mới bắt chước hoàn hảo được.
Nguồn tham khảo