Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
en
Trang chủChuyên mụcArcadeĐã lưu
Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
AI & AutomationCông nghệ

Drama Qwen 3.5: Khi lũ 'tiểu yêu' 9B đấm vỡ mồm mấy con hàng khủng long

3 tháng 3, 20263 phút đọc

Qwen 3.5 vừa thả xích loạt model nhỏ gọn. Anh em GPU 'khoai tây' sướng rơn vì hiệu năng ảo ma, trong khi mấy ông ôm card to đang hoang mang tột độ.

Chia sẻ bài viết:
ai generated, ai, microchip, artificial intelligence, robot, technology, digital, computer science, future, digitization, futuristic, network, communication, data, web, cyborg, computer, information, data exchange, robotics, internet, processor
Nguồn gốc: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeuNguồn gốc: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu
Nguồn gốc: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeuNguồn gốc: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen-3-5-small-models-ra-mat-cuu-tinh-may-yeu
qwen 3.5localllamaai modelpotato gpullm
Chia sẻ bài viết:

Bình luận

Sáng ra chưa kịp hớp ngụm cafe nào đã thấy giang hồ đồn đại Qwen 3.5 vừa thả xích một loạt model phiên bản "tí hon". Nghe đâu mấy con hàng này nhỏ mà có võ, định viết lại định nghĩa về hiệu năng trên máy yếu. Để tôi vào việc luôn cho nóng.

Rốt cuộc là chuyện quái gì đang xảy ra?

Team Qwen (của mấy pháp sư Trung Hoa Alibaba) vừa âm thầm "drop" một loạt các biến thể nhỏ của Qwen 3.5. Không kèn không trống, nhưng chấn động thì khỏi bàn.

Cụ thể là các size siêu nhỏ kiểu 0.8B, 1.5B, 3B và 9B. Mục tiêu là gì? Là để mấy ông dev nghèo chạy trên laptop ghẻ, hay thậm chí là nhét AI vào cái điện thoại cùi bắp. Cái thời mà phải cầm A100 mới chạy được model ngon có vẻ sắp hết rồi anh em ạ.

Dân tình Reddit đang tế sống hay tung hô?

Lượn một vòng cái động r/LocalLLaMA, tôi thấy không khí như trẩy hội. Mấy ông dev đang sướng rơn người:

  • Team "Máy Khoai Tây" (Potato GPU) mở tiệc: Một ông thần tên cms2307 thốt lên: "Con 9B này kẹp giữa GPT-OSS 20B và 120B luôn. Đúng là Giáng sinh đến sớm cho mấy thằng card yếu như tao". Ngay lập tức, Lorian0x7 vào bơm đểu thêm: "Thật ra nó đấm vỡ mồm con 120B ở hầu hết các bài test, trừ khoản coding ra nhé". Nghe ảo ma Canada chưa?

  • Thợ rèn (Quantizers) vào việc: Ông stopbanni với đội ngũ Unsloth đã tay nhanh hơn não, lôi ngay con 0.8B ra quantize (nén) lại rồi. Tốc độ cứ gọi là bàn thờ.

  • Góc nhìn kỹ thuật: Thanh niên sonicnerd14 tỉnh táo hơn, quăng ngay cái "hotfix" bằng cơm: "Mấy ông nhớ chỉnh prompt tắt cái chế độ 'thinking' đi, set temperature tầm 0.45 thôi. Mấy con 3.5 này bị cái bệnh 'nghĩ nhiều' (overthink) rồi tự hủy, nói lan man chả ra đâu vào đâu. Cơ mà công nhận Vision (nhìn ảnh) của nó nét hơn hẳn".

  • Góc hoài niệm: Firepal64 thì ngồi cười khẩy: "Hài thật, cái thời GPT-2 ra mắt, 2 tỷ tham số (2B) là to vật vã. Giờ 2B người ta gọi là 'micro', dành cho điện thoại". Đúng là vật đổi sao dời.

Góc nhìn từ Coding4Food: Ngon, bổ, nhưng liệu có rẻ?

Thực tế mà nói, vụ này là tin cực vui cho anh em Indie Hacker hoặc mấy ông muốn build tool tự động hóa chạy local 24/7.

Thứ nhất, chi phí vận hành giảm tụt quần. Không cần thuê server khủng, con NUC ở nhà cũng cân tốt. Thứ hai, quyền riêng tư. Chạy local thì bố ai biết ông đang hỏi nó cái gì, tha hồ mà "nghịch".

Tuy nhiên, đừng có hype quá đà. Model nhỏ vẫn là model nhỏ, nó có thể thông minh đột xuất nhưng cũng có thể ngu bất thình lình (hallucination). Nhất là cái vụ "overthink" mà dân mạng đang kêu ca, anh em code app nhớ handle vụ prompt cho kỹ, không nó lại trả lời đi vào lòng đất.

Tóm cái váy lại: Tải về mà test đi, RAM 8GB cũng chơi được thì tội gì không thử?

Nguồn tham khảo

Reddit: Breaking - The small qwen3.5 models have been dropped

Bài viết liên quan

ai generated, neural, brain, technology, network, digital, mind, data, information, neurons, biotech, nanotechnology, science, head, electronics, cybernetics, cyberspace, singularity, robot, future, computer, chip, processor, intelligence
Công nghệAI & Automation

Google thả xích Gemma 4 12B: Không thèm xài Encoder, kèo này thơm hay lại bánh vẽ?

Google vừa tung Gemma 4 12B với kiến trúc multimodal encoder-free. Giang cư mận HN đang rần rần. Liệu có đủ tuổi đọ lại Llama hay chỉ là content lùa gà?

4 thg 64 phút đọc
Đọc tiếp →
evolution, artificial intelligence, brain, ghost, progress, smoke, digitization, change, matrix, printed circuit board, circuit board, control center, automation, evolution, evolution, evolution, evolution, evolution, artificial intelligence, artificial intelligence, artificial intelligence, artificial intelligence, brain, brain
AI & AutomationCông nghệ

Bóc trần sự thật AI: Khi giang cư mận phát hiện siêu trí tuệ chỉ là 'một đống weights'

Cười té ghế với bài parody 'They're made out of weights' trên Hacker News. Hóa ra AI thần thánh cũng chỉ là mấy ma trận số nhân với nhau mà thôi!

4 thg 64 phút đọc
Đọc tiếp →
binary, one, cyborg, cybernetics, circuit board, technology, monitor, think, circuits, microprocessor mode, controlled, puppet, artificial intelligence, function, printed circuit board, digital, intelligent, futuristic, computer science, zero, robot, continents, earth, world, binary code, binary system, byte, bits, computer, computer viruses, computer virus, data, data exchange, communication, web, network, programming, server, script, trojan, virus, virus warning, artificial intelligence, artificial intelligence, artificial intelligence, artificial intelligence, artificial intelligence, computer science, server, server
AI & AutomationCông nghệ

Bóc phốt 'thợ gõ API': Stanford tung khóa CS336 dạy code LLM từ cõi hư vô

Stanford vừa ném vào mặt giới tech khóa học CS336: Language Modeling from Scratch. Đã đến lúc phân biệt AI Engineer real và thợ gọi API OpenAI.

2 thg 63 phút đọc
Đọc tiếp →
phone, iphone, mobile, green, smartphone
Công nghệAI & Automation

Needle: Khi pháp sư ép Tool Calling của Gemini vào con AI bé bằng hột é

Cộng đồng mạng đang xôn xao vụ dev nhà Cactus nhét tính năng Tool Calling vào model 26M tham số, bỏ mịa luôn FFN. Chạy mượt trên điện thoại ghẻ!

14 thg 53 phút đọc
Đọc tiếp →
writing, typewriter, office, business, torpedo, paper, type, vintage, old, key, analogue, technology, write, antique, writing, writing, writing, writing, writing
AI & AutomationCông nghệ

Talkie 13B: Khi pháp sư rảnh háng lôi AI về thập niên 1930

Drama, SaaS rác, GPT wrappers... Quên hết đi! Anh em vào xem con LLM 13B cắn thuốc quay ngược thời gian về năm 1930 đang làm mưa làm gió trên Hacker News đây này.

29 thg 44 phút đọc
Đọc tiếp →
artificial intelligence, robot, ai, ki, program, programming, computer, environment, syntax, data processing, advertisement, hacker, html, web design, development, developer, language, code, software, website, programmers of the future, computer science, technology, think, html, html, html, html, html
AI & AutomationCông nghệ

Đánh giá Step 3.7 Flash: 11B Params, 400 TPS - Đồ Chơi Mới Cho Anh Em Thích Cắm Auto Agents

Step 3.7 Flash ra mắt trên Product Hunt: 11B Params, hỗ trợ 256k context, chạy bao mượt lên tới 400 TPS. Hàng ngon cho anh em dev hệ thực dụng, lười setup.

31 thg 53 phút đọc
Đọc tiếp →