MiniMax M2.7 vừa lên sóng HuggingFace nhưng lại khiến giang cư mận r/LocalLLaMA khóc thét vì cắn VRAM và dính quả license hãm tài. Cùng hóng biến!

Đang cặm cụi fix bug với ly cà phê đá đã nhạt toét, lướt r/LocalLLaMA thì thấy quả bom MiniMax M2.7 rớt xuống HuggingFace. Tưởng ngon ăn định bế về vọc vạch làm con pet AI local, ai dè đọc xong cái cấu hình đòi hỏi với cái license thì tôi nhận ra... mình đ*o có cửa các ông ạ.
Tóm tắt nhanh cho anh em lười đọc: Đội ngũ MiniMax vừa push con hàng M2.7 lên HuggingFace. Về lý thuyết thì thông số mượt, benchmark đẹp, hứa hẹn sẽ là một thế lực mới trong làng local LLM. Nhìn cái graph thì mlem mlem thật đấy, nhưng ngay khi anh em tải về thì nhận ra đời không như mơ. Nó to, nó nặng, và nó "cắn RAM" ác liệt. Thay vì là một buổi ra mắt tung hô, nó lại trở thành nơi anh em dev bóc phốt độ "hút máu" tài nguyên của con hàng này.
Dạo một vòng Reddit, tôi thấy các đạo hữu chia làm mấy phe rõ rệt, đọc comment mà cười ẻ:
1. Nỗi đau của hệ "nhà nghèo" VRAM Có ông than thở ôm con GPU 16GB VRAM ngồi nhìn các file quants (bản nén) mà nước mắt tuôn rơi, ngậm ngùi nhận ra "làm người nghèo khổ thật". Cao trào nhất là một thanh niên vừa tậu con Mac M5 Pro 48GB đang tiếc đứt ruột vì không ráng lên hẳn M5 Max 128GB. Nhưng đau đớn thay, một lão quái vào bồi thêm câu sát thương chí mạng: "Ủa mầy nghĩ 128GB chạy nổi con này hả?". Toang!
2. Quả License "hãm tài" quay xe gắt Nhiều pháp sư tính down về fine-tune làm SaaS để lùa gà, nhưng vỡ mộng ngay tắp lự. Bản release lần này dính cái Non-Commercial License (Phi thương mại). Anh em dev đang chửi thề um sùm vì có ngon đến mấy mà không cho kiếm tiền thì cũng chỉ để ngắm.
3. Ánh sáng le lói từ API Giữa rừng tiếng khóc, một số cao nhân thực dụng lại chỉ ra chân lý: Tội gì phải tải về? Có ông review rắng mua gói API 10 đô/tháng của bọn MiniMax xài tòe mỏ, request liên tọi mà đ*o bao giờ chạm được đến cái limit tuần. Ngon, bổ, rẻ, khỏi lo tiền điện!
Anh em ạ, qua vụ này mới thấy, đú trend AI local nó ảo ma lắm. Đừng có bị FOMO rồi cắm sổ đỏ đi build dàn máy 500 củ chỉ để chạy mấy cái model dăm ba bữa lại lỗi thời.
Nếu anh em không có ngân sách, hãy ngoan ngoãn làm con nghiện API. Còn nếu dự án bắt buộc phải self-host, bảo mật cao các kiểu, thì khuyên thật là cứ thuê mẹ cái máy chủ cloud mà chạy cho khỏe, lúc nào chán thì tắt, tội gì ôm rơm rặm bụng?
Và cuối cùng, bài học muôn thuở cho các anh em định khởi nghiệp: Code cái gì thì code, nhớ check kỹ cái License. Nhắm mắt nhắm mũi lấy hàng non-commercial đi bán SaaS thì có ngày bị luật sư của bọn nó khóa mõm đấy nhé.
Nguồn hóng hớt: Reddit - r/LocalLLaMA