Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
en
Trang chủChuyên mụcArcadeĐã lưu
Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
Công nghệAI & Automation

Needle: Khi pháp sư ép Tool Calling của Gemini vào con AI bé bằng hột é

14 tháng 5, 20263 phút đọc

Cộng đồng mạng đang xôn xao vụ dev nhà Cactus nhét tính năng Tool Calling vào model 26M tham số, bỏ mịa luôn FFN. Chạy mượt trên điện thoại ghẻ!

Chia sẻ bài viết:
phone, iphone, mobile, green, smartphone
Nguồn gốc: https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26mNguồn gốc: https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m
Nguồn gốc: https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26mNguồn gốc: https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/needle-ai-nhet-gemini-tool-calling-vao-model-26m
needle aigemini tool callingllmaimachine learningcactus computeai model
Chia sẻ bài viết:

Bình luận

Bài viết liên quan

architect, man, jump, jumping, building, joy, planning, professional, employee, builder, worker, contractor, male, work, development, housing, home, build, building, worker, worker, work, work, work, home, home, home, home, home
AI & AutomationCông nghệ

Genpire: Gõ Prompt Ra Đôi Giày, AI Nay Đã Biết Mở Xưởng Gia Công?

AI không chỉ gõ code mà nay còn ném thẳng bản vẽ kỹ thuật (tech pack) xuống xưởng sản xuất. Cùng soi xem Genpire là mỏ vàng hay bánh vẽ lùa gà?

12 thg 54 phút đọc
Đọc tiếp →
writing, typewriter, office, business, torpedo, paper, type, vintage, old, key, analogue, technology, write, antique, writing, writing, writing, writing, writing
AI & AutomationCông nghệ

Talkie 13B: Khi pháp sư rảnh háng lôi AI về thập niên 1930

Drama, SaaS rác, GPT wrappers... Quên hết đi! Anh em vào xem con LLM 13B cắn thuốc quay ngược thời gian về năm 1930 đang làm mưa làm gió trên Hacker News đây này.

29 thg 44 phút đọc
Đọc tiếp →
brain, circuit board, artificial intelligence, technology, conductor tracks, connections, network, digital, think, cut out, artificial intelligence, artificial intelligence, artificial intelligence, artificial intelligence, artificial intelligence
Công nghệAI & Automation

Liminary: Khi AI ngừng 'ngáo đá' và học cách đọc não dev

Liminary vừa lên top Product Hunt với lời hứa biến mớ bòng bong data của bạn thành 'não phụ' cho AI. Bánh vẽ hay phao cứu sinh thực sự?

14 thg 53 phút đọc
Đọc tiếp →
ai generated, child, computer, robot, laptop, technology, fantasy, mystical, future, digital
Công nghệAI & Automation

Googlebook: Sự Lột Xác Của Chromebook Hay Chỉ Là Quả Lừa Chạy Bằng AI?

Google sắp ra mắt Googlebook chạy Aluminium OS tích hợp Gemini AI. Cú hick công nghệ mới hay chỉ là mớ bòng bong cắn RAM? Cùng Coding4Food bóc tách.

14 thg 53 phút đọc
Đọc tiếp →
humanoid, robot, woman, future, technology, futuristic, robotic, cyborg, generated by ai
AI & AutomationCông nghệ

MolmoAct 2: Quả bom Open-Source 700 giờ data tát thẳng mặt hội giấu bài AI Robotics

Review sương sương con hàng MolmoAct 2 từ Ai2. Điều khiển robot 2 tay không cần fine-tune, đính kèm 700 giờ dataset free cho anh em ML tha hồ cày cuốc.

10 thg 54 phút đọc
Đọc tiếp →
robot, future, modern, technology, science fiction, artificial, intelligence, robotic, computer, mechanical, engineering, artificial intelligence, gray robot, 3d, render, robot, robot, robot, robot, robot, technology, artificial intelligence
AI & AutomationCông nghệ

Oriane: 'Pháp sư' AI giúp mổ xẻ video TikTok, CTO gáy khét lẹt vụ giảm cost 1000 lần

Bóc phốt Oriane trên Product Hunt: Tool AI social listening mới xưng danh 'mắt và tai' cho hệ thống AI, giải quyết nỗi đau của MrBeast và màn tối ưu cost đỉnh cao.

6 thg 54 phút đọc
Đọc tiếp →

Đang ngồi code dạo bằng con máy quạt kêu như máy cày, lướt HN tự nhiên thấy một quả "Show HN" khá ảo ma: nhét tính năng Tool Calling của Gemini vào một cái model bé xíu xiu 26M tham số. Các pháp sư Cactus vừa thả xích con quái vật mini này, hứa hẹn chạy mượt trên cả mấy con điện thoại ghẻ, đồng hồ thông minh. Đúng kiểu nhỏ mà có võ.

Tóm tắt pha "ép xung" não AI xuống bằng hạt cát

Chuyện là thanh niên Henry từ team Cactus vừa open-source một con model tên là Needle. Nhìn sơ qua thông số thì anh em sẽ thấy nó dị nhường nào:

  • Bé hạt tiêu: Nặng đúng 26M tham số (để dễ hình dung thì nó nhẹ hơn cả cái thư mục node_modules rác rưởi của anh em).
  • Tốc độ bàn thờ: Quất 6000 token/s prefill và 1200 token/s decode ngay trên thiết bị cá nhân.
  • Insight đi thẳng vào vấn đề: Mấy lão này nhận ra việc gắn tool (function calling) bản chất là bài toán tìm kiếm và lắp ráp (match query -> trích xuất tham số -> nhả JSON), đ*o phải suy luận triết học phức tạp. Bắt mấy con LLM siêu to khổng lồ làm việc này là đao to búa lớn.
  • Kiến trúc dị giáo: Model này mạnh dạn vứt sạch mạng nơ-ron truyền thống (MLP/FFN). Chỉ có Attention và Gating. Tác giả bảo FFN là phí phạm tài nguyên nếu thông tin (facts) đã có sẵn trong input (kiểu RAG hay tool use).
  • Cày cuốc: Pretrain 200B tokens mất 27 tiếng trên 16 con TPU v6e, sau đó post-train thêm 2B tokens data tổng hợp từ Gemini trong 45 phút.
  • Thực chiến: Đấm vỡ mồm mấy con to con hơn như FunctionGemma-270M hay Qwen-0.6B trong bài test gọi hàm single-shot.

Giang cư mận chém gió gì về pha cắt xén này?

(Dù tác giả vừa post chưa kịp để lại nhiều comment, nhưng lượn lờ các diễn đàn thì anh em dev chia phe khá rõ rệt)

  • Đội ngũ "thực dụng": Quá xịn xò con bò! Cuối cùng cũng có người hiểu rằng bắt con AI 70B tham số chỉ để bật cái đèn thông minh hay tạo file JSON là cực kỳ cắn RAM và hao điện. Nhét mấy cái ai tools nhỏ gọn này vào app là chân ái.
  • Pháp sư đa nghi: Cắt bỏ FFN nghe rất ma giáo. Chạy single-shot thì mượt mượt đấy, nhưng liệu ghép vào chuỗi hội thoại phức tạp nhiều bối cảnh thì có bị ngáo ngơ không?
  • Dân cày Local: Đã clone repo về finetune thử trên Mac. Chạy mấy cái này nhẹ đầu, không cần phải thuê máy chủ đắt đỏ hay ngốn sạch tài nguyên.

Góc nhìn từ Coding4Food: Bài học "biết mình biết ta"

Thực tế phũ phàng là anh em dev mình hay bị FOMO. Đụng cái là lôi OpenAI API hay tải mấy con LLM khủng bố về xài, trong khi task đôi khi chỉ là parse cái chuỗi string ra JSON hoặc gọi một cái API thời tiết. Vụ này chứng minh: Tool đúng việc thì nhỏ cũng có võ, không cần thiết lúc nào cũng vác dao mổ trâu đi giết gà.

Kiến trúc bỏ FFN của Cactus là một nước đi rất thú vị cho dân làm edge-computing. Đừng cố bắt một con AI làm thi sĩ khi bạn chỉ cần nó làm một thằng thu ngân biết đếm tiền. Chốt lại, vãn bối bái phục. Đạo hữu nào muốn tối ưu chi phí thì tải về nghịch ngay cho nóng!

Nguồn hóng hớt: Show HN: Needle: We Distilled Gemini Tool Calling into a 26M Model