Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
en
Trang chủChuyên mụcArcadeĐã lưu
Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
AI & AutomationĐồ Nghề & Tech Stack

Qwen3.5-35B-A3B: Quái vật Coding chạy Local khiến anh em 3090 sướng rơn người

26 tháng 2, 20264 phút đọc

Dẹp benchmark ảo ma đi, thực tế con hàng Qwen3.5-35B-A3B chạy trên RTX 3090 code như thần, giải đề phỏng vấn 5 tiếng trong 10 phút. Anh em dev vào xem ngay!

Chia sẻ bài viết:
matrix, code, computer, pc, data, program, computer virus, programming, zoom background, coding, wallpaper, matrix, matrix, matrix, matrix, matrix, code, code, computer, computer, data, data, programming, coding, coding
Nguồn gốc: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-reviewNguồn gốc: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review
Nguồn gốc: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-reviewNguồn gốc: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/qwen3-5-35b-a3b-coding-local-review
qwen3.5-35blocal llmai codingrtx 3090llama.cppai agentopencode
Chia sẻ bài viết:

Bình luận

Mấy nay giang hồ đang đồn đại về con hàng Qwen3.5-35B-A3B, bảo là "game changer" gì đó. Thú thật với các ông, tôi nghe mấy cái benchmark lòe loẹt là tôi ngán tận cổ rồi, toàn "lùa gà" là chính. Nhưng lần này, một dân chơi trên Reddit đã trực tiếp test con này trên máy nhà (local) và kết quả phải nói là... ảo ma Canada thật sự.

Anh em nào đang ôm mấy con card RTX 3090 hay 4090 cũ mèm ở nhà thì rửa tai mà nghe, kèo này thơm phức.

1. Vụ án "Quái vật" 35B trên máy tính cá nhân

Chuyện là có ông thần trên Reddit (tạm gọi là "Chủ Thớt") không tin vào mấy con số benchmark nên quyết định tự tay vọc vạch. Cấu hình lão dùng là một con headless Linux box cắm duy nhất 1 con RTX 3090. Lão biên dịch lại Llama.cpp mới nhất và chạy con model Qwen3.5-35B-A3B-MXFP4_MOE.gguf.

Cấu hình lão chạy đại khái như này (anh em nào thích vọc thì copy về mà paste):

./llama.cpp/llama-server \ -m /models/Qwen3.5-35B-A3B-MXFP4_MOE.gguf \ -a "DrQwen" \ -c 131072 \ -ngl all \ -ctk q8_0 \ -ctv q8_0 \ -sm none \ -mg 0 \ -np 1 \ -fa on

Kết quả? Nó ngốn khoảng 22GB VRAM (vừa khít con 3090 luôn, mượt chưa?). Và đây là những thứ khiến tôi phải giật mình:

  • Tốc độ bàn thờ: Nó bắn ra hơn 100 tokens/giây (t/s). Nhanh hơn cả người yêu cũ trở mặt.
  • Hủy diệt bài test tuyển dụng: Chủ thớt lôi bài test coding "tủ" dùng để tuyển Mobile Dev Mid-level ra thử. Bình thường người thật làm mất 5 tiếng, con AI này nó quẩy xong trong 10 phút. Kết quả: Strong Pass (Đậu chót vót).
  • Clone Dashboard trong một nốt nhạc: Lão thử tái tạo lại cái dashboard mà OpenAI từng demo cho Cursor mùa hè năm ngoái. Qwen3.5 làm gỏi cái đó trong 5 phút.

Cơ bản là: Con này chạy local, không tốn tiền API, nhanh, và code khôn hơn khối ông dev ngồi rung đùi cắn móng tay.

2. Cộng đồng Dev nói gì? (Combat cực căng)

Ngay khi bài viết lên sóng, anh em đồng đạo đã lao vào mổ xẻ nhiệt tình. Dưới đây là mấy luồng ý kiến chính tôi gom nhặt được:

  • Phe "Rich Kid" Flex cấu hình: Một tay chơi dùng RTX 5090 (vâng, 5090 đấy) vào comment nhẹ nhàng: "Tao chạy được 180 t/s nhé". Đúng là tiền nhiều để làm gì, để chạy AI nhanh hơn người khác chứ làm gì.
  • Phe "Táo Khuyết" (Macbook): Mấy ông dùng M4 Max cũng không chịu thua kém, báo cáo chạy được tầm 60 t/s với LMStudio. Tuy không bằng đám RTX nhưng với laptop thì cũng là "hết nước chấm".
  • Phe "Soi Kèo": Có ý kiến so sánh con này với Sonnet 4.5 (hàng xịn của Anthropic). Họ đánh giá Qwen 27B/35B code ngang ngửa Sonnet 4.5, tư duy rất tốt, biết search web thay vì chém gió (hallucinate) lung tung. Nhược điểm duy nhất là kiến thức chuyên sâu đôi khi bị "hụt hơi" do số lượng tham số (parameter) thấp hơn bọn model khổng lồ.
  • Cảnh báo của các "Pháp sư": Một thanh niên (chickN00dle) cảnh báo anh em cẩn thận vụ Quantization (nén model). Nếu để KV cache ở mức thấp quá (Q4), model dễ bị "ngáo" khi context dài lên tới 20-40k tokens, đặc biệt là viết sai LaTeX. Khuyên anh em nên dùng Q8 cho cache nếu dư VRAM.

3. Góc nhìn từ Coding4Food: Chén cơm hay là toang?

Nói đi cũng phải nói lại, vụ này cho thấy hai điều:

  1. Local AI đã thực sự dùng được: Không cần phải cúng tiền cho OpenAI hay Anthropic mỗi tháng nữa. Với một con GPU tầm trung cao (3090/4090 cũ giờ giá cũng mềm), anh em có thể tự dựng một con "Junior Dev" không biết mệt mỏi ngay tại nhà. Bảo mật tuyệt đối, code dự án công ty không sợ bị leak.
  2. Bài học xương máu: Nếu một con AI chạy trên máy cá nhân giải quyết bài test tuyển dụng 5 tiếng trong 10 phút, thì hoặc là bài test của chúng ta quá phế, hoặc là tiêu chuẩn tuyển dụng sắp thay đổi chóng mặt.

Chốt hạ: Anh em dev đừng cười vội. Tải về vọc ngay đi xem nó code thế nào. Đừng để đến lúc đi phỏng vấn bị thằng AI nó "outplay" thì lúc đấy lại bảo tại số.

Nguồn tham khảo: Reddit

Bài viết liên quan

ai, image, ai image, technology, robot, chatgpt, chatbot, future, bot, laptop, computer, cyber, ai generated, ai, ai, ai, ai, ai, ai image, ai image
AI & AutomationCông nghệ

Pancake AI: Nhét nguyên cái công ty vào Slack chạy tự động, tương lai hay cú lùa gà?

Đánh giá Pancake, công cụ biến Slack thành công ty chạy bằng AI tự động. Dev hóng drama hay nên lo giữ cần câu cơm trước sức mạnh của AI agents?

29 thg 54 phút đọc
Đọc tiếp →
bedroom, cupboard, bed, room, sofa, window, living room, modern, bedroom, bedroom, bedroom, bedroom, room, room, room, room, room, window, living room, living room, living room, living room
AI & AutomationCông nghệ

Đem đống API "đồ cổ" cắm vào AI Agent: Appfactor thả xích MCP Bridge giải cứu anh em

Cắm API vào AI agent bằng tay cắn RAM quá? MCP Bridge ra đời để giải quyết đống rác legacy. Cùng C4F hóng xem tool này có bị úp sọt hay không.

29 thg 54 phút đọc
Đọc tiếp →
robot, educational toy, robotics, companion robot, mini robot
AI & AutomationChuyện Nghề

Dùng AI để code CHẬM lại: Nghe có vẻ ngược đời nhưng lại cứu rỗi sinh mệnh Dev?

Giang hồ đồn thổi AI giúp dev code nhanh x10. Nhưng một cao nhân Hacker News lại bảo: Dùng AI để code chậm lại mới là chân ái. Cùng mổ xẻ xem thực hư thế nào.

26 thg 55 phút đọc
Đọc tiếp →
ai generated, hacker, computer, robot, technology, room, boy, child, hacker, hacker, hacker, hacker, hacker
AI & AutomationĐồ Nghề & Tech Stack

Re_gent: Tool 'bắt lỗi' AI Agent cực gắt cho anh em hệ lười code

Bị AI Agent phá nát project mà đ*o biết tại sao? Re_gent xuất hiện như một đấng cứu thế giúp anh em trace lỗi, blame prompt và rollback mượt mà.

21 thg 54 phút đọc
Đọc tiếp →
robot, artificial intelligence, brain, think, control, electrical engineering, technology, developer, computer, hacker, cyborg, machine learning, computer science, information, programming, coding, data, web, laptop, hacking, security, terminator, future, machine learning, machine learning, machine learning, machine learning, machine learning
AI & AutomationCông nghệ

Cào Data Mù Quáng Đã Lỗi Thời: Firecrawl Tung /monitor Cứu Ví Dev Khỏi Ác Mộng Cắn Token

Firecrawl ra mắt /monitor giúp dev dẹp trò cào data mù quáng bằng cronjob. Chỉ ping webhook khi web đổi, tiết kiệm 90% token. Giang cư mận phản ứng ra sao?

30 thg 54 phút đọc
Đọc tiếp →
ui, blank, design, template, symbol, interface
AI & AutomationCông nghệ

Góc hóng hớt: Montage M1 - Cứu cánh cho anh em dev khỏi kiếp AI gen UI rùa bò

Montage M1 vừa húp 95 điểm Product Hunt. Giải pháp server-side compile UI siêu mượt cho AI Agent, giúp anh em bớt cắn token và thoát kiếp render giật lag.

18 thg 54 phút đọc
Đọc tiếp →