
Đang ngồi uống cốc trà đá cắn hạt hướng dương, lướt Product Hunt thấy con MiniMax-M2.7 leo top mà toát mồ hôi hột các ông ạ. Bữa trước mấy con AI cùi bắp gen code lỗi tè le, anh em còn vỗ đùi cười cợt "bọn này còn khướt mới cướp được bát cơm của tao", thế mà nay mọi chuyện có vẻ đang quay xe khét lẹt.
Tóm tắt nhanh cho anh em lười đọc: Con M2.7 này đ*o phải là một cái model tĩnh (static) như các tool thông thường. Nó tự định nghĩa bản thân là một mô hình "tự tiến hóa" (self-evolving). Nghĩa là sao? Là nó có khả năng tự tạo môi trường làm việc, tự thiết lập các "Agent Teams" để phối hợp xử lý những cục task to tướng như code, debug và research.
Nghe ảo ma chưa? Chưa hết đâu. Hồi tháng trước, pháp sư ẩn danh @MiniMax tung ra bản M2.5 với điểm số SOTA vã vỡ mặt cái SWE-Bench Verified (80.2%). Giờ con M2.7 ra mắt, tỷ lệ win-rate đè bẹp bản cũ lên tới 88%.
Điểm ăn tiền nhất của nó là vòng lặp tự tiến hóa: Chạy thử -> Tạch -> Tự phân tích xem tại sao tạch -> Tự sửa lại cấu hình -> Chạy lại. Rất ma giáo! Nó hành xử y như một thằng Junior Dev đang try-hard cày cuốc ngày đêm, chỉ khác là nó không đòi tăng lương và không bao giờ bật sếp.
Dạo một vòng qua phần bình luận, dân tình đang chia làm mấy luồng ý kiến cực gắt:
Phe phân tích hệ thống (Thực dụng): Một ông làm data science cho bóng đá gật gù bảo hướng đi này chuẩn cmnr. Khi làm thực tế, dữ liệu thay đổi liên tục, model tĩnh chắc chắn là dị giáo vì đ*o ai báo cho bạn biết feature nào đang bị lệch. Nhưng ông này cũng ném ra một câu hỏi chí mạng: "Làm sao để cân bằng giữa việc cho nó tự vọc vạch (exploration) và độ ổn định khi chạy thật (exploitation)? Đang chạy production mà nó tự đổi config thì có mà sập server à? Liệu có nút 'freeze' không?"
Phe cuồng tính năng "Nhớ dai": Đa số các AI agent hiện tại não cá vàng vãi nồi, reset session là bay sạch trí nhớ. Con M2.7 này có "Long-term memory" (trí nhớ dài hạn). Vài anh em cho rằng đây là chìa khóa xịn xò con bò để unlock năng suất. Tuy nhiên, các lão quái lại lo ngại: "Cái memory này hoạt động kiểu gì? Có cho user vào edit hay xóa không, hay lại là một cái black box (hộp đen)? Tương data mật của công ty vào đấy sếp lại chả gõ cho to đầu."
Phe rén & thuyết âm mưu: Nhiều vãn bối bái phục sức mạnh của nó nhưng cũng rén: "Nó tự tiến hóa, tự chạy scale lớn mà làm sai thì quản lý kiểu đo gì?"*. Trong enterprise, sự ổn định ăn đứt dăm ba cái trò múa skill. Việc trao quyền kiểm soát cho một hệ thống tự động vẫn là một canh bạc.
Trò chơi thay đổi rồi anh em ạ. Thời mà dev coi AI chỉ là cái tool gõ phím hộ (autocomplete) sắp qua. Chẳng mấy chốc, việc của anh em mình không phải là căng mắt ra fix từng dòng bug nữa, mà là "quản lý" một bầy Agent.
Việc cấp bách bây giờ là học cách giao task (prompt engineering level cao), học cách quản trị rủi ro hệ thống, và biết cách thiết lập "biên giới" để bọn AI này không làm những pha tự hủy đi vào lòng đất. Hãy làm một người quản lý xịn thay vì một thợ gõ phím lười biếng.
Nguồn: Product Hunt - MiniMax-M2.7
MiniMax M2.7 ra mắt mang theo tính năng tự tiến hóa, tự fix bug và lập team collab ảo ma. Liệu bát cơm của anh em dev có còn vững trước cơn sóng này?