DeepMind vừa ném quả bom Gemma 4. Cùng hóng xem 500 anh em dev Hacker News bóc phốt, test nhân phẩm con hàng AI mới này xem có đáng để cắn RAM không.

Lại một ngày bình thường ở Thung lũng Silicon, anh em vừa pha xong cốc cà phê chưa kịp nhấp thì Google lại ném cái Gemma 4 vào mặt. Má, tốc độ đẻ model của mấy pháp sư DeepMind dạo này còn nhanh hơn cách nyc trở mặt!
Google DeepMind vừa chính thức thả xích cho series Gemma 4. Tiếng là "Open models" nghe cao cả vãi, nhưng anh em trong ngành thừa biết tỏng đây là "open weights" thôi. Nghĩa là cho các ông cái xác model về chạy thử, còn data train nó bằng cái gì thì "bí mật kinh doanh nhé mấy cưng". Đ*o ai rảnh mà open source 100% cho thiên hạ copy.
Đợt này Google hứa hẹn kiến trúc mới, tối ưu phần cứng tốt hơn, chạy mượt mà không cần phải cắm mấy con GPU to bằng cái lò vi sóng. Đối với mấy anh em đam mê vọc vạch các thể loại ai tools để tự động hóa công việc thì đây rõ ràng là một món đồ chơi xịn xò con bò. Nhưng đời đ*o như mơ, cứ phải test mới biết được.
Bài post về Gemma 4 vọt lên top 1 Hacker News với tận 1200 điểm. Dân tình chia phe combat nảy lửa cmnl:
Góc nhìn thực dụng nhé: Model mới thì ngon đấy, nhưng anh em dev mình cứ bình tĩnh, giữ chặt cần câu cơm. Đừng có vội đập hết code cũ, xóa sạch prompt cũ để đắp cái Gemma 4 này vào dự án công ty ngay lập tức. Bể production sếp lại tế sống lên bây giờ.
Kinh nghiệm xương máu là cứ để đó 1-2 tuần. Đợi mấy pháp sư rảnh háng trên mạng họ test chán chê, tung ra mấy bản optimize (quantization GGUF các kiểu) cho nhẹ mượt, fix hết bug ngầm đi, rồi mình từ từ bú mút sau cũng chưa muộn.
Thế nhé, anh em nào tay to máy khỏe thì cứ kéo về vọc thử, còn tôi đi fix cái bug CSS căn giữa div từ đời Tống đây.
Nguồn hóng hớt: Hacker News - Google releases Gemma 4 open models