Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
en
Trang chủChuyên mụcArcadeĐã lưu
Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
AI & AutomationĐồ Nghề & Tech Stack

Chạy Local Qwen 3.5: Khi Dàn PC Ghẻ Cũng Thể Cân Được AI Xịn

9 tháng 3, 20264 phút đọc

Drama và review thực tế từ anh em Hacker News về việc bế Qwen 3.5 về chạy offline. Ép xung phần cứng, nhồi nhét VRAM và những pha lú não vì GGUF.

Chia sẻ bài viết:
gpu, component, videocard, gpu, gpu, gpu, gpu, gpu
Nguồn gốc: https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-gheNguồn gốc: https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe
Nguồn gốc: https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-gheNguồn gốc: https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/chay-local-qwen-3-5-tren-pc-ghe
qwen 3.5local llmllama.cppunslothai offline
Chia sẻ bài viết:

Bình luận

Dạo này giang hồ đang kháo nhau rần rần vụ bế con AI xịn xò về chạy ngay trên máy ở nhà. Đ*o cần nạp VIP cho mấy pháp sư OpenAI hay Anthropic, anh em hoàn toàn có thể tự thẩm Qwen 3.5 ngay trên cái dàn PC ghẻ của mình.

Chuyện quái gì đang xảy ra với Qwen 3.5?

Mới đây, Unsloth tung ra bộ tài liệu hướng dẫn chạy local Qwen 3.5, và ngay lập tức cái topic này leo rank ầm ầm trên Hacker News. Thay vì phải cúng tiền subcription hàng tháng, giờ đây anh em dev đang thi nhau ép xung con card màn hình cùi bắp ở nhà để tự chạy AI. Điều ảo ma nhất là Qwen 3.5 tỏ ra quá bá đạo trên các dòng phần cứng dân dụng. Từ việc code dạo, OCR, cho đến làm trợ lý ảo, con hàng này đang khiến nhiều pháp sư phải quay xe, suy nghĩ lại về việc có nên tiếp tục xài API online hay không.

Giang cư mận đang test "hàng" thế nào?

Dạo một vòng comment, có thể thấy các đồng đạo đang chia làm mấy hệ phái test máy cực kỳ ma giáo:

1. Phái "Đỗ nghèo khỉ" nhưng thích đú: Một lão quái có nick Twirrim thề thốt rằng lão đang chạy bản 35B-A3B trên con card RTX 3050 (8GB VRAM) mà vẫn mượt mà, gánh task code ầm ầm. Thậm chí có thanh niên xài đồ cổ 1660 Ti 6GB VRAM, vọc vạch CachyOS kẹp với llama.cpp-cuda, vẫn ép nó chạy được bản 35B. Cảm giác vắt kiệt từng MB VRAM nó phê chữ ê kéo dài anh em ạ.

2. Phái "Bơi trong VRAM": Mấy đại gia sở hữu GPU 16GB (như 4070ti hay 4080) thì kẹp LM Studio chạy bản 9B, bú phát ~100 tokens/giây. Tốc độ này ăn đứt mấy cái service API lùa gà trên mạng. Đặc biệt, có cao nhân còn nhét vừa bản 27B quantize (ép kiểu 4-bit) vào con card 16GB, và claim rằng chất lượng output ngang ngửa Claude Sonnet. Khét lẹt!

3. Phái "Tẩu hỏa nhập ma" vì định dạng: Đây là hệ quả của việc có quá nhiều chuẩn nén. Một loạt anh em đang kêu trời vì cái bảng chữ cái quái quỷ của định dạng GGUF (IQ4_XS, Q4_K_M, UD-Q4_K_XL...). Đọc xong đ*o hiểu phải tải file nào cho hợp với cái Mac Mini M4 ở nhà. Việc thiếu một cái bảng mapping chuẩn giữa "Phần cứng - Model - Config" đang làm dân tình lú lẫn.

4. Phái "Thực dụng phần cứng": Nhiều ông chốt hạ luôn: PC Gaming thì hợp để chạy model cỏ. Apple Silicon (Mac M-series) là chân ái để cõng mấy model bự mà không sợ cháy nhà. Còn nếu tiền không thành vấn đề? Cứ táng Nvidia. Bí quá đ*o có card thì thuê mịa một con máy chủ cloud mà vọc cho lẹ.

Góc nhìn từ Coding4Food: Chốt hạ để giữ cần câu cơm

Rõ ràng kỷ nguyên Local LLM đang vả đôm đốp vào mặt mấy dịch vụ cloud AI đắt đỏ. Qwen 3.5 chứng minh rằng anh em dev hoàn toàn có thể sở hữu một con đệ tử AI code dạo chạy offline với chi phí cực rẻ.

Nhưng mà khoan vội gáy. Việc nhét một con AI to chà bá vào phần cứng yếu bắt buộc phải qua nhào nặn (quantization), đồng nghĩa với việc nó sẽ ngu đi một chút và thi thoảng vẫn "ngáo đá" (hallucinate). Bài học ở đây là: Dùng nó để pair-programming thì tuyệt vời, nhưng nhắm mắt copy-paste code của nó mà đ*o review thì có ngày sập server, hotfix ốm đòn nhé các đạo hữu!

Nguồn hóng hớt: Hacker News - How to run Qwen 3.5 locally

Bài viết liên quan

matrix, code, computer, pc, data, program, computer virus, programming, zoom background, coding, wallpaper, matrix, matrix, matrix, matrix, matrix, code, code, computer, computer, data, data, programming, coding, coding
AI & AutomationĐồ Nghề & Tech Stack

Qwen3.5-35B-A3B: Quái vật Coding chạy Local khiến anh em 3090 sướng rơn người

Dẹp benchmark ảo ma đi, thực tế con hàng Qwen3.5-35B-A3B chạy trên RTX 3090 code như thần, giải đề phỏng vấn 5 tiếng trong 10 phút. Anh em dev vào xem ngay!

26 thg 24 phút đọc
Đọc tiếp →
ai generated, cpu, processor, chip, computer, electronics, data, technology, tech, hardware, circuits, motherboard, connections, microchip, cpu, cpu, processor, processor, processor, processor, processor, chip, chip, technology, tech, hardware, motherboard, microchip
AI & AutomationCông nghệ

Qwen 3.5 Small đổ bộ: Cứu tinh cho hội 'PC khoai tây' hay lại bánh vẽ?

Team Qwen lại vừa thả xích dàn model 3.5 Small. Anh em dev máy yếu vào húp vội, còn dân nhiều VRAM thì tính bài spec-decoding. Hóng ngay!

2 thg 33 phút đọc
Đọc tiếp →
ai generated, robot, human rights, artificial intelligence, science fiction, futuristic, cyborg, android, robotics, future, binary, code, privacy policy, woman, man, musculature, blue, silver, isolated, sci fi, fit, face, view
AI & AutomationCông nghệ

Đem AI giấu xuống gầm giường với LumiChats Offline: Không GPU, Không Internet, Không sợ 'bế' code

Anh em mệt mỏi vì dùng AI bị leak code công ty? LumiChats Offline vừa lên sóng, hàng OSS chạy local 100%, không cần GPU, miễn phí hoàn toàn. Hóng xem giang cư mận nói gì!

11 thg 54 phút đọc
Đọc tiếp →
ai generated, robot, cyborg, technology, artificial intelligence, future, automation, electronics, science fiction, cyberpunk, chatbot, chatgpt, automation, automation, automation, automation, automation, chatbot, chatbot, chatgpt, chatgpt, chatgpt, chatgpt
AI & AutomationCông nghệ

CraftBot cà khịa OpenClaw: Chạy Local Agent một dòng lệnh, cho AI 'ngủ mơ' lúc 3h sáng

CraftBot xuất hiện trên Product Hunt với 186 upvotes, tuyên bố giải quyết triệt để 'nỗi đau' của anh em xài OpenClaw bằng tính năng tối ưu token và quản lý bộ nhớ ma giáo.

19 thg 44 phút đọc
Đọc tiếp →
laptop, hands, gadgets, iphone, apple, lens, macbook, mobile phone, smartphone, typing, blogging, flat lay, workspace, laptop, laptop, typing, typing, typing, typing, typing, blogging, blogging, blogging
Công nghệAI & Automation

Google nhét Gemma 4 vào iPhone: Màn cà khịa cực mạnh từ nhà sếp G

Hóng drama Google tung app AI Edge Gallery chạy local mô hình Gemma 4 ngay trên iPhone. Cú tát thẳng mặt Apple hay chỉ là màn flex công nghệ cắn RAM?

6 thg 43 phút đọc
Đọc tiếp →
chip, processor, circuit, computer, technology, digital, network, cpu, hardware, electronics, communication, cutout
Công nghệAI & Automation

Tiny Aya: Khi Pháp Sư Cohere Chán Làm AI 'Béo Phì', Chuyển Sang Hệ Local Ngon Bổ Rẻ

Cohere vừa tung Tiny Aya - mô hình AI 3.35B siêu nhẹ chạy mượt trên thiết bị local, chia làm 3 hệ phái vùng miền. Anh em dev có thêm đồ chơi mới để vọc.

6 thg 43 phút đọc
Đọc tiếp →