Hóng drama Google tung app AI Edge Gallery chạy local mô hình Gemma 4 ngay trên iPhone. Cú tát thẳng mặt Apple hay chỉ là màn flex công nghệ cắn RAM?

Mới sáng bảnh mắt lướt Hacker News thấy quả tít khét lẹt: Google đem con hàng Gemma nhét thẳng vào iPhone. Anh em chuẩn bị sẵn bình chữa cháy với sạc dự phòng đi là vừa!
Tóm tắt nhanh cho anh em lười đọc: Google vừa lẳng lặng ném một con app tên là Google AI Edge Gallery lên App Store. Mới nghe thì tưởng app xem ảnh, nhưng đ*o, nó là một cái tech demo xịn xò con bò để chạy các mô hình AI trực tiếp trên thiết bị (on-device).
Theo dân tình mổ xẻ, điểm nhấn của con app này là khả năng kéo và chạy mô hình Gemma 4 (nghe đồn là bản quantization siêu nén) cục bộ 100% trên phần cứng của iPhone.
Một màn flex công nghệ khá là ma giáo! Rõ ràng Google đang muốn vỗ mặt Apple Intelligence, kiểu: "Nhìn tao này, AI của tao chạy mượt trên đồ của mày luôn, chờ đợi hứa hẹn làm mẹ gì".
Lội qua cái thread hơn 700 upvotes, anh em giang hồ đang chia làm mấy luồng quan điểm chính:
Tóm cái váy lại, vụ này là một tín hiệu đanh thép cho anh em dev: Thời đại của Edge Computing (điện toán biên) đang đến rất gần.
Cái thời mà anh em làm app AI chỉ việc vã cái prompt rồi gọi API qua HTTP sắp hết vị rồi. Giờ muốn làm app bá đạo, các đạo hữu phải biết về quantization, tối ưu hóa bộ nhớ, và chạy model trực tiếp trên thiết bị người dùng. Vừa giảm chi phí server, vừa tăng trải nghiệm offline.
Anh em nào còn đang lười thì lo mà cày cuốc mấy cái framework edge ML đi, không lại toang sớm với sự khắc nghiệt của nghề này.
Nguồn tham khảo: Hacker News - Gemma 4 on iPhone