Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
en
Trang chủChuyên mụcArcadeĐã lưu
Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
AI & AutomationCông nghệ

Drama Qwen 3.5: Khi lũ 'tiểu yêu' 9B đấm vỡ mồm mấy con hàng khủng long

3 tháng 3, 20263 phút đọc

Qwen 3.5 vừa thả xích loạt model nhỏ gọn. Anh em GPU 'khoai tây' sướng rơn vì hiệu năng ảo ma, trong khi mấy ông ôm card to đang hoang mang tột độ.

Chia sẻ bài viết:
ai generated, ai, microchip, artificial intelligence, robot, technology, digital, computer science, future, digitization, futuristic, network, communication, data, web, cyborg, computer, information, data exchange, robotics, internet, processor
Nguồn gốc: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeuNguồn gốc: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu
Nguồn gốc: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeuNguồn gốc: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu
qwen 3.5localllamaai modelpotato gpullm
Chia sẻ bài viết:

Bình luận

Sáng ra chưa kịp hớp ngụm cafe nào đã thấy giang hồ đồn đại Qwen 3.5 vừa thả xích một loạt model phiên bản "tí hon". Nghe đâu mấy con hàng này nhỏ mà có võ, định viết lại định nghĩa về hiệu năng trên máy yếu. Để tôi vào việc luôn cho nóng.

Rốt cuộc là chuyện quái gì đang xảy ra?

Team Qwen (của mấy pháp sư Trung Hoa Alibaba) vừa âm thầm "drop" một loạt các biến thể nhỏ của Qwen 3.5. Không kèn không trống, nhưng chấn động thì khỏi bàn.

Cụ thể là các size siêu nhỏ kiểu 0.8B, 1.5B, 3B và 9B. Mục tiêu là gì? Là để mấy ông dev nghèo chạy trên laptop ghẻ, hay thậm chí là nhét AI vào cái điện thoại cùi bắp. Cái thời mà phải cầm A100 mới chạy được model ngon có vẻ sắp hết rồi anh em ạ.

Dân tình Reddit đang tế sống hay tung hô?

Lượn một vòng cái động r/LocalLLaMA, tôi thấy không khí như trẩy hội. Mấy ông dev đang sướng rơn người:

  • Team "Máy Khoai Tây" (Potato GPU) mở tiệc: Một ông thần tên cms2307 thốt lên: "Con 9B này kẹp giữa GPT-OSS 20B và 120B luôn. Đúng là Giáng sinh đến sớm cho mấy thằng card yếu như tao". Ngay lập tức, Lorian0x7 vào bơm đểu thêm: "Thật ra nó đấm vỡ mồm con 120B ở hầu hết các bài test, trừ khoản coding ra nhé". Nghe ảo ma Canada chưa?

  • Thợ rèn (Quantizers) vào việc: Ông stopbanni với đội ngũ Unsloth đã tay nhanh hơn não, lôi ngay con 0.8B ra quantize (nén) lại rồi. Tốc độ cứ gọi là bàn thờ.

  • Góc nhìn kỹ thuật: Thanh niên sonicnerd14 tỉnh táo hơn, quăng ngay cái "hotfix" bằng cơm: "Mấy ông nhớ chỉnh prompt tắt cái chế độ 'thinking' đi, set temperature tầm 0.45 thôi. Mấy con 3.5 này bị cái bệnh 'nghĩ nhiều' (overthink) rồi tự hủy, nói lan man chả ra đâu vào đâu. Cơ mà công nhận Vision (nhìn ảnh) của nó nét hơn hẳn".

  • Góc hoài niệm: Firepal64 thì ngồi cười khẩy: "Hài thật, cái thời GPT-2 ra mắt, 2 tỷ tham số (2B) là to vật vã. Giờ 2B người ta gọi là 'micro', dành cho điện thoại". Đúng là vật đổi sao dời.

Góc nhìn từ Coding4Food: Ngon, bổ, nhưng liệu có rẻ?

Thực tế mà nói, vụ này là tin cực vui cho anh em Indie Hacker hoặc mấy ông muốn build tool tự động hóa chạy local 24/7.

Thứ nhất, chi phí vận hành giảm tụt quần. Không cần thuê server khủng, con NUC ở nhà cũng cân tốt. Thứ hai, quyền riêng tư. Chạy local thì bố ai biết ông đang hỏi nó cái gì, tha hồ mà "nghịch".

Tuy nhiên, đừng có hype quá đà. Model nhỏ vẫn là model nhỏ, nó có thể thông minh đột xuất nhưng cũng có thể ngu bất thình lình (hallucination). Nhất là cái vụ "overthink" mà dân mạng đang kêu ca, anh em code app nhớ handle vụ prompt cho kỹ, không nó lại trả lời đi vào lòng đất.

Tóm cái váy lại: Tải về mà test đi, RAM 8GB cũng chơi được thì tội gì không thử?

Nguồn tham khảo

Reddit: Breaking - The small qwen3.5 models have been dropped

Bài viết liên quan

ai generated, server, data centre, computer, rack, digital, processor, technology, modern art, server, server, server, server, server
Công nghệAI & Automation

MiniMax M2.7 Lên Sóng: Cú Tát VRAM Khét Lẹt Cho Anh Em "Nhà Nghèo"

MiniMax M2.7 vừa lên sóng HuggingFace nhưng lại khiến giang cư mận r/LocalLLaMA khóc thét vì cắn VRAM và dính quả license hãm tài. Cùng hóng biến!

12 thg 43 phút đọc
Đọc tiếp →
Qwen3.6-Max-Preview Bất Ngờ Thả Xích: Pháp Sư Trung Hoa Lại Flex Đồ Chơi Mới
Công nghệAI & Automation

Qwen3.6-Max-Preview Bất Ngờ Thả Xích: Pháp Sư Trung Hoa Lại Flex Đồ Chơi Mới

Alibaba vừa tung Qwen3.6-Max-Preview. Lại thêm một con AI đòi đấm nhau với GPT-4o. Cùng xem giang cư mận chém gió gì về vụ này.

21 thg 43 phút đọc
Đọc tiếp →
teamwork, cooperation, brainstorming, business, finance, office, team, partners, flat lay, meeting, collaboration, corporation, management, support, team building, unity, teamwork, business, business, business, business, business, office, office, team, team, meeting
AI & AutomationCông nghệ

Bóc phốt Tokenizer của Claude 4.7: Code mượt nhưng bill API có 'cắn' tiền?

Claude 4.7 xịn thì xịn thật, nhưng có ai để ý cái tokenizer mới nó tính tiền anh em thế nào không? Cùng xem một pháp sư HN mổ xẻ chi phí thực tế.

18 thg 43 phút đọc
Đọc tiếp →
soap bubble, frost bubble, ice crystals, frozen, winter, cold, bubble, backlighting, freeze, winter, winter, winter, winter, winter, bubble
AI & AutomationCông nghệ

Sự thật 'ảo ma' về Local LLaMA: Khi AI khen nhau thảo mai và nướng bánh mì bằng... bê tông

Hóng drama r/LocalLLaMA: Chuyện gì xảy ra khi các pháp sư chạy AI ở local? Bánh mì bê tông, AI thảo mai và những cú lừa 'Local o3' tấu hài cực mạnh.

10 thg 44 phút đọc
Đọc tiếp →
ai generated, artificial intelligence, brain, robot, ai, machine, cyber brain, iot, web3, iot, iot, iot, iot, iot
AI & AutomationCông nghệ

Gemma 4 của Google ra mắt: Pháp sư DeepMind cũng trầy trật, giang cư mận la ó vì rổ bug

Toàn cảnh drama ra mắt Gemma 4 của Google DeepMind. Đội dev cày bục mặt, nhưng lúc release thì cộng đồng Reddit khóc thét vì bug ngập mặt và thuyết âm mưu cực gắt.

7 thg 44 phút đọc
Đọc tiếp →
ai generated, neural, network, pathways, brain, neuronal, thinking, intelligence, idea, connection, psychology
AI & AutomationCông nghệ

OpenRouter Model Fusion: Bắn 1 prompt, chục con AI xúm vào hầu hạ và cái kết 'lắm thầy thối ma'?

OpenRouter tung tính năng Model Fusion cho phép nhét 1 câu hỏi cho nhiều con AI trả lời rồi chọn ý hay nhất. Xịn xò hay toang? Cùng mổ xẻ dưới góc nhìn dev.

5 thg 44 phút đọc
Đọc tiếp →