Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
en
Trang chủChuyên mụcArcadeĐã lưu
Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
AI & AutomationĐồ Nghề & Tech Stack

Qwen3.5-35B-A3B: Quái vật Coding chạy Local khiến anh em 3090 sướng rơn người

26 tháng 2, 20264 phút đọc

Dẹp benchmark ảo ma đi, thực tế con hàng Qwen3.5-35B-A3B chạy trên RTX 3090 code như thần, giải đề phỏng vấn 5 tiếng trong 10 phút. Anh em dev vào xem ngay!

Chia sẻ bài viết:
matrix, code, computer, pc, data, program, computer virus, programming, zoom background, coding, wallpaper, matrix, matrix, matrix, matrix, matrix, code, code, computer, computer, data, data, programming, coding, coding
Nguồn gốc: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-reviewNguồn gốc: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review
Nguồn gốc: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-reviewNguồn gốc: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review
qwen3.5-35blocal llmai codingrtx 3090llama.cppai agentopencode
Chia sẻ bài viết:

Bình luận

Bài viết liên quan

Bỏ tiền mua Claude Pro Max: Chọt 1 tiếng rưỡi hết quota, Dev khóc ròng tế sống Anthropic
Drama ITAI & Automation

Bỏ tiền mua Claude Pro Max: Chọt 1 tiếng rưỡi hết quota, Dev khóc ròng tế sống Anthropic

Bỏ tiền mua gói Pro Max của Claude nhưng mới gõ code được 1.5 tiếng đã cạn mana. Cùng hóng biến GitHub issue 45756 đang làm anh em dev sôi máu.

13 thg 44 phút đọc
Đọc tiếp →
grand central station, new york, grand central terminal, manhattan, architecture, nyc, terminal, transport, america, landmark, building, travel, people, famous, midtown, tourism, crowd, flag, hall, new york, new york, new york, new york, new york, crowd, hall
AI & AutomationĐồ Nghề & Tech Stack

Anthropic tung /ultraplan cho Claude Code: Khỏi lo AI 'ngáo' bóp nát source code

Claude Code ra mắt lệnh /ultraplan giúp chuyển bước planning từ CLI lên giao diện web. Tha hồ comment, review sướng tay trước khi cho AI đụng vào source code local.

12 thg 44 phút đọc
Đọc tiếp →
ai generated, mask, man, anonymous, cyber threat, hacker, cybernetic, code, crime, cyberspace, hacker, hacker, hacker, hacker, hacker
Đồ Nghề & Tech StackAI & Automation

LaReview: Tool Review Code Của Pháp Sư Rust Chống Lại Lũ AI Spam Comment

Quên cái cảnh kéo chuột mỏi tay để đọc diff đi. LaReview biến PR thành task tree, chạy local không lo lộ code, viết bằng Rust mượt mà cho anh em dev.

11 thg 43 phút đọc
Đọc tiếp →
code, html, digital, coding, web, programming, computer, technology, internet, design, development, website, web developer, web development, programming code, data, page, computer programming, software, site, css, script, web page, website development, www, information, java, screen, code, code, code, html, coding, coding, coding, coding, coding, web, programming, programming, computer, technology, website, website, web development, software
AI & AutomationĐồ Nghề & Tech Stack

Thẩm định Cursor 3: Chạy nhiều AI Agent cùng lúc, xịn xò hay lại báo thủ?

Cursor 3 vừa ra mắt tính năng cho AI Agent chạy song song và chuyền ban Local-Cloud. Nghe thì ảo ma Canada đấy, nhưng anh em dev nói gì? Cùng C4F mổ xẻ.

4 thg 44 phút đọc
Đọc tiếp →
coding, programming, working, macbook, laptop, technology, office, desk, business, coding, coding, coding, coding, coding, programming, programming, programming
Công nghệAI & Automation

Intent AI: Thêm một tool 'lùa gà' hay pháp sư mới nổi giải cứu Dev?

Cùng mổ xẻ Intent - tool AI mới nổi trên Product Hunt tự xưng là workspace điều phối agent. Đọc ngay để biết là hàng real hay lại lùa gà anh em dev.

16 thg 44 phút đọc
Đọc tiếp →
ai generated, woman, mechanisms, complex, mechanics, robot, wires, circuits
AI & AutomationCông nghệ

Anthropic thả xích 'Claude Advisor': Trò mới cứu ví dev hay chỉ là bình cũ rượu mới?

Anthropic vừa ra mắt tính năng Claude Advisor, đảo ngược tư duy multi-agent truyền thống. Giải pháp này có thực sự giúp anh em dev giảm bill API?

11 thg 44 phút đọc
Đọc tiếp →

Mấy nay giang hồ đang đồn đại về con hàng Qwen3.5-35B-A3B, bảo là "game changer" gì đó. Thú thật với các ông, tôi nghe mấy cái benchmark lòe loẹt là tôi ngán tận cổ rồi, toàn "lùa gà" là chính. Nhưng lần này, một dân chơi trên Reddit đã trực tiếp test con này trên máy nhà (local) và kết quả phải nói là... ảo ma Canada thật sự.

Anh em nào đang ôm mấy con card RTX 3090 hay 4090 cũ mèm ở nhà thì rửa tai mà nghe, kèo này thơm phức.

1. Vụ án "Quái vật" 35B trên máy tính cá nhân

Chuyện là có ông thần trên Reddit (tạm gọi là "Chủ Thớt") không tin vào mấy con số benchmark nên quyết định tự tay vọc vạch. Cấu hình lão dùng là một con headless Linux box cắm duy nhất 1 con RTX 3090. Lão biên dịch lại Llama.cpp mới nhất và chạy con model Qwen3.5-35B-A3B-MXFP4_MOE.gguf.

Cấu hình lão chạy đại khái như này (anh em nào thích vọc thì copy về mà paste):

./llama.cpp/llama-server \ -m /models/Qwen3.5-35B-A3B-MXFP4_MOE.gguf \ -a "DrQwen" \ -c 131072 \ -ngl all \ -ctk q8_0 \ -ctv q8_0 \ -sm none \ -mg 0 \ -np 1 \ -fa on

Kết quả? Nó ngốn khoảng 22GB VRAM (vừa khít con 3090 luôn, mượt chưa?). Và đây là những thứ khiến tôi phải giật mình:

  • Tốc độ bàn thờ: Nó bắn ra hơn 100 tokens/giây (t/s). Nhanh hơn cả người yêu cũ trở mặt.
  • Hủy diệt bài test tuyển dụng: Chủ thớt lôi bài test coding "tủ" dùng để tuyển Mobile Dev Mid-level ra thử. Bình thường người thật làm mất 5 tiếng, con AI này nó quẩy xong trong 10 phút. Kết quả: Strong Pass (Đậu chót vót).
  • Clone Dashboard trong một nốt nhạc: Lão thử tái tạo lại cái dashboard mà OpenAI từng demo cho Cursor mùa hè năm ngoái. Qwen3.5 làm gỏi cái đó trong 5 phút.

Cơ bản là: Con này chạy local, không tốn tiền API, nhanh, và code khôn hơn khối ông dev ngồi rung đùi cắn móng tay.

2. Cộng đồng Dev nói gì? (Combat cực căng)

Ngay khi bài viết lên sóng, anh em đồng đạo đã lao vào mổ xẻ nhiệt tình. Dưới đây là mấy luồng ý kiến chính tôi gom nhặt được:

  • Phe "Rich Kid" Flex cấu hình: Một tay chơi dùng RTX 5090 (vâng, 5090 đấy) vào comment nhẹ nhàng: "Tao chạy được 180 t/s nhé". Đúng là tiền nhiều để làm gì, để chạy AI nhanh hơn người khác chứ làm gì.
  • Phe "Táo Khuyết" (Macbook): Mấy ông dùng M4 Max cũng không chịu thua kém, báo cáo chạy được tầm 60 t/s với LMStudio. Tuy không bằng đám RTX nhưng với laptop thì cũng là "hết nước chấm".
  • Phe "Soi Kèo": Có ý kiến so sánh con này với Sonnet 4.5 (hàng xịn của Anthropic). Họ đánh giá Qwen 27B/35B code ngang ngửa Sonnet 4.5, tư duy rất tốt, biết search web thay vì chém gió (hallucinate) lung tung. Nhược điểm duy nhất là kiến thức chuyên sâu đôi khi bị "hụt hơi" do số lượng tham số (parameter) thấp hơn bọn model khổng lồ.
  • Cảnh báo của các "Pháp sư": Một thanh niên (chickN00dle) cảnh báo anh em cẩn thận vụ Quantization (nén model). Nếu để KV cache ở mức thấp quá (Q4), model dễ bị "ngáo" khi context dài lên tới 20-40k tokens, đặc biệt là viết sai LaTeX. Khuyên anh em nên dùng Q8 cho cache nếu dư VRAM.

3. Góc nhìn từ Coding4Food: Chén cơm hay là toang?

Nói đi cũng phải nói lại, vụ này cho thấy hai điều:

  1. Local AI đã thực sự dùng được: Không cần phải cúng tiền cho OpenAI hay Anthropic mỗi tháng nữa. Với một con GPU tầm trung cao (3090/4090 cũ giờ giá cũng mềm), anh em có thể tự dựng một con "Junior Dev" không biết mệt mỏi ngay tại nhà. Bảo mật tuyệt đối, code dự án công ty không sợ bị leak.
  2. Bài học xương máu: Nếu một con AI chạy trên máy cá nhân giải quyết bài test tuyển dụng 5 tiếng trong 10 phút, thì hoặc là bài test của chúng ta quá phế, hoặc là tiêu chuẩn tuyển dụng sắp thay đổi chóng mặt.

Chốt hạ: Anh em dev đừng cười vội. Tải về vọc ngay đi xem nó code thế nào. Đừng để đến lúc đi phỏng vấn bị thằng AI nó "outplay" thì lúc đấy lại bảo tại số.

Nguồn tham khảo: Reddit