PrismML ra mắt model ảnh Bonsai 4B chạy ngay trên trình duyệt

Chào anh em đồng đạo. Dạo này mấy pháp sư AI đua nhau tung model ầm ầm, lướt newsfeed mà ngộp thở. Hôm nay, có một cái thớt trên Reddit đang rần rần vụ PrismML tung ra con hàng Binary & Ternary Bonsai Image 4B. Nghe cái tên Bonsai tôi lại tưởng đâu phần mềm dạy cắt tỉa cây cảnh, ai dè nó là một con text-to-image chạy thẳng trên trình duyệt các ông ạ.

Rốt cuộc con hàng Bonsai 4B này có vẹo gì mà anh em hú hét?

Tóm tắt nhanh cho anh em lười đọc, đội dev PrismML vừa nhào nặn ra một cái model siêu dị. Điểm ăn tiền lớn nhất? Nó là 1-bit/ternary text-to-image diffusion. Dịch ra tiếng người thì tức là nó bị "ép xung" lượng tử hóa xuống mức cực kỳ tối giản.

Dung lượng nhẹ vãi chưởng: Toàn bộ model chỉ nặng khoảng 3GB (lúc tải về thực tế ngốn tầm 2GB thôi). Anh em cứ thử so với con quái vật FLUX.2 Klein 4B cắn RAM tung đít tận 16GB thì sẽ thấy 3GB nó thần thánh cỡ nào.
Chạy 100% local trên trình duyệt: Model này xài WebGPU. Nghĩa là đo cần thuê máy chủ đắt đỏ, đo cần tải UI rườm rà hay setup Python loằng ngoằng. Mở Chrome/Edge lên là quất.
Mã nguồn mở: License Apache-2.0 đàng hoàng, xịn xò con bò, tha hồ mà vọc vạch.

Giang cư mận Reddit hít hà ra sao?

Đem chuông đi đánh xứ người thì 9 người 10 ý. Dưới cái thớt 500+ upvote, anh em dev chia phe bàn luận tấu hài cực mạnh:

1. Phe ngáo ngơ và pháp sư ẩn danh Lão Fun_Librarian_7699 lên than thở: "Đọc cái tên Bonsai, tôi cứ tưởng dùng để tạo ra mấy cái cây bonsai kiểu pixel-block cơ. Hơi thất vọng". Tưởng đùa, ai dè một lão quái tên Zulfiqaar nhảy vào rep luôn: "Tôi cũng thấy ý tưởng đó hay vãi!". Và thế là lão này xách mấy cái ai tools như Claude, Kimi, Codex ra code cật lực. Nhoáng cái lão thả luôn cái link Github và Demo một con app Voxel Tree Morph thật 100%. Bá đạo thật sự, vãn bối bái phục độ rảnh và giỏi của các pháp sư!

2. Hội người nghèo lo xa Thanh niên Natural-Rich6 hỏi một câu muôn thuở của làng chơi local AI: "Thế nó có chạy được trên CPU và 16GB RAM không?". Yên tâm nhé đạo hữu, model có 3GB, chạy trên WebGPU thì máy khoai tây cũng lết được.

3. Đội UI/UX ngứa mắt Một nhóm khác thì đ*o thèm quan tâm đến độ xịn của model, mà tập trung soi... giao diện web. Thanh niên yuletide thốt lên: "Cái quái gì với cái kiểu lạm dụng chữ in nghiêng (italic) trên mấy trang web AI dạo này thế?". Đồng dâm Icy-Pay7479 hùa theo: "Thề, tuần này tôi thấy cái layout kiểu này 3 lần rồi". Bệnh nghề nghiệp thật sự, thấy template lùa gà là chê ngay.

Góc nhìn từ Coding4Food

Tóm cái váy lại, vụ này cho thấy trend nhúng AI thẳng vào trình duyệt bằng WebGPU đang lên ngôi mạnh mẽ. Việc ép một con model diffusion từ mười mấy GB xuống còn 3GB mà chất lượng vẫn dùng được là một bước tiến rất ma giáo.

Bài học sinh tồn cho anh em dev: Tương lai làm Web/Front-end mà biết kéo mấy con model nhẹ hều này về chạy client-side, giảm tải tiền server API thì chắc chắn là sẽ có giá hơn hẳn. Còn chần chừ gì mà không lôi máy ra test thử?

Nguồn hóng hớt: Reddit - LocalLLaMA

Rốt cuộc con hàng Bonsai 4B này có vẹo gì mà anh em hú hét?

Dung lượng nhẹ vãi chưởng: Toàn bộ model chỉ nặng khoảng 3GB (lúc tải về thực tế ngốn tầm 2GB thôi). Anh em cứ thử so với con quái vật FLUX.2 Klein 4B cắn RAM tung đít tận 16GB thì sẽ thấy 3GB nó thần thánh cỡ nào.

Chạy 100% local trên trình duyệt: Model này xài WebGPU. Nghĩa là đo cần thuê máy chủ đắt đỏ, đo cần tải UI rườm rà hay setup Python loằng ngoằng. Mở Chrome/Edge lên là quất.

Mã nguồn mở: License Apache-2.0 đàng hoàng, xịn xò con bò, tha hồ mà vọc vạch.

Giang cư mận Reddit hít hà ra sao?

Đem chuông đi đánh xứ người thì 9 người 10 ý. Dưới cái thớt 500+ upvote, anh em dev chia phe bàn luận tấu hài cực mạnh:

Góc nhìn từ Coding4Food

PrismML tung model Bonsai 4B: Chạy AI vẽ tranh thẳng trên trình duyệt đ*o cần card khủng!

Rốt cuộc con hàng Bonsai 4B này có vẹo gì mà anh em hú hét?

Giang cư mận Reddit hít hà ra sao?

Góc nhìn từ Coding4Food

Bình luận

Rốt cuộc con hàng Bonsai 4B này có vẹo gì mà anh em hú hét?

Giang cư mận Reddit hít hà ra sao?

Góc nhìn từ Coding4Food

Bài viết liên quan

Ức chế vì tool cùi, sinh viên tự code luôn app Note tích hợp Local AI cực khét

Shadow V2 lên sóng: Giải cứu anh em khỏi cái kiếp 'copy - paste - prompt' khi xài AI

OpenHuman: Con AI Agent 'Vả Mặt' Hội Pháp Sư Thích Code YAML Cồng Kềnh

Local AI Mới Là Chân Ái: Bế AI Về Nhà Nuôi Hay Cứ Cúng Tiền Cho Big Tech?

Feather: Pháp sư ẩn danh mất 4 tháng code tool chỉnh ảnh Local AI, chọc ngoáy trực tiếp Lightroom

Show HN: Apfel - "Khui" sức mạnh AI ẩn giấu trên Mac của anh em, mượt mà và miễn phí!