Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
en
Trang chủChuyên mụcArcadeĐã lưu
Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
AI & AutomationCông nghệ

Google nổ bom Gemini Embedding 2: Cứu rỗi pipeline cho anh em làm RAG hay lại 'lùa gà'?

11 tháng 3, 20263 phút đọc
cloud computing, network, internet, cloud computing concept, communication, networking, virtual, cloud technology, black computer, black technology, black laptop, black clouds, black network, black community, black internet, black communication, cloud computing, cloud computing, cloud computing, cloud computing, cloud computing
Nguồn gốc: https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-ragNguồn gốc: https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag
Nguồn gốc: https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-ragNguồn gốc: https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/google-gemini-embedding-2-cuu-roi-pipeline-rag
gemini embedding 2ragmultimodal aigoogle aisemantic searchai embedding
Chia sẻ bài viết:

Bình luận

Chào anh em đồng dâm dev. Dạo này loanh quanh trên mạng toàn thấy mấy con LLM sinh chữ múa mỏ, nhưng cái lõi đằng sau để làm RAG ngon nghẻ thì ít ai nhắc. Vừa rồi, Google mới ném ra quả bom mang tên "Gemini Embedding 2". Nghe chữ "embedding" có vẻ khô khan học thuật, nhưng đọc kỹ tài liệu thì quả này giải quyết đúng nỗi đau của anh em thợ code đấy.

Đỡ phải múa rườm rà - Tóm tắt nhanh hàng mới của anh Gồ

Anh em nào từng làm AI search hay RAG chắc đều hiểu cái cảnh cồng kềnh của data đa phương tiện (multimodal). Hồi trước, muốn hệ thống hiểu được đống lẩu thập cẩm, các ông phải chạy qua 7749 bước tiền xử lý: âm thanh thì phải cắm vào speech-to-text, ảnh thì phải gọi API image-captioning, video thì băm frame ra rồi tính tiếp... Tóm lại là nát bét cái pipeline, chậm, dễ bug mà còn cắn tài nguyên máy chủ kinh khủng.

Nhưng với Gemini Embedding 2, Google cho phép dập tất cả text, ảnh, video, audio và file PDF vào chung một không gian (single embedding space) - và quan trọng là nó chạy native. Nghĩa là sao? Nghĩa là ông ném thẳng cái file mp3 vào, nó tự cắn mà đ*o cần qua bước phiên mã (transcription). Ảo ma chưa?

Vài thông số phần cứng cho anh em thị dâm:

  • Xử lý một nhát lên tới 8192 token text.
  • Nhồi được 6 ảnh/request, video dài max 120 giây, và đọc lướt PDF 6 trang.
  • Hỗ trợ hơn 100 ngôn ngữ.
  • Có trò Matryoshka Representation Learning (nén dimension từ 3072 xuống 768) cho anh em nào thích tối ưu storage.

Giang cư mận và các pháp sư AI nói gì?

Lượn lờ hóng hớt trên ProductHunt, đa số các lão quái đều gật gù pha này Google đánh trúng tim đen của dev.

Một pháp sư tên Rohan (chuyên review tool) khen lấy khen để vụ dẹp bỏ sự phân mảnh. Ông này chỉ ra rằng dev AI bây giờ có thể build hệ thống RAG, phân tích sentiment hay semantic search dễ thở hơn nhiều. Thay vì phải chắp vá các model riêng lẻ lại với nhau, giờ anh em xài một cục duy nhất là xong việc.

Nhiều anh em khác thì sướng rơn vì khả năng search chéo (cross-modal) giờ mượt hơn hẳn. Tưởng tượng các ông gõ một câu text và lôi ra được đúng đoạn video có cảnh đó, mà không cần phải cắm mặt viết metadata cho từng frame.

Góc nhìn thực dụng từ Coding4Food

Thú thật thì đồ nhà Google đang ở mác "public preview", nên khuyên anh em đọc docs thì cứ trừ hao đi 30%. Test trên data mẫu của hãng thì lúc nào chả mượt cho đến khi các ông mang về đấm vào data rác thực tế của cty mình.

Nhưng tóm cái váy lại, xu hướng gom chung multimodal vào một model embedding nguyên bản chắc chắn là tương lai. Anh em nào đang cày cuốc làm AI Assistants, Knowledge Bases hay Search engine thì lo update giáo án dần đi. Việc bớt đi vài ba cái API tiền xử lý lẻ tẻ không chỉ tiết kiệm tiền server mà còn cứu rỗi hàng ngàn giờ debug ngu học. Đáng để thử!

Nguồn: Product Hunt - Gemini Embedding 2

Google ra mắt Gemini Embedding 2 gom text, ảnh, video, âm thanh vào chung một không gian. Pha này giúp anh em dev dẹp bỏ đống pipeline tiền xử lý cồng kềnh.

Chia sẻ bài viết:

Bài viết liên quan

android, android icon, android logo, android symbol, social networks, networks, internet, network, social, social network, soon, social media, app, subscribe, button, communication, interface, icon, android, android, android, android, android, android logo, android logo
AI & AutomationCông nghệ

Bóc mẻ Inrō AI: Tool chốt đơn Instagram mác 'AI Agent' hay pháp sư real?

Inrō AI đang lọt top Product Hunt với danh xưng AI Agent tự chốt đơn Instagram. Cùng soi gầm xe xem tech stack của các pháp sư này có gì hot hay lại lùa gà?

26 thg 44 phút đọc
Đọc tiếp →
artificial intelligence, coding, programming, software, code, robot, computer, website, technology, matrix, program, development, server, html, cartoon, data, communication, command prompt, robotics, cyborg
Công nghệAI & Automation

Bơm Oxy Cho AI Agent Lên Production: Khi Gọi API Chỉ Là Trò Trẻ Con

Gọi API LLM thì dễ, nhưng đưa AI Agent lên Production thì đẫm nước mắt. Hóng hớt xem tool mới tên Logic giải quyết vụ eval, RAG, và model routing ảo ma cỡ nào.

28 thg 43 phút đọc
Đọc tiếp →
call center, headset, woman, service, consulting, information, conversation, continents, global, international, headphones, phone, help, call, corporate, booking, make a phone call, pc, call center, call center, call center, call center, call center, service, service, service, call
Công nghệAI & Automation

Sale bằng AI: Vũ khí tối thượng hay cú lừa 'người máy đọc lệnh'?

Knowzilla - tool AI mớm lời real-time cho đội sales vừa lên top Product Hunt. Liệu đây là phao cứu sinh cho junior hay chỉ là trò lùa gà? Cùng bóc tách.

21 thg 44 phút đọc
Đọc tiếp →
ai generated, robot, cyborg, technology, artificial intelligence, future, automation, electronics, science fiction, cyberpunk, chatbot, chatgpt, automation, automation, automation, automation, automation, chatbot, chatbot, chatgpt, chatgpt, chatgpt, chatgpt
AI & AutomationCông nghệ

CraftBot cà khịa OpenClaw: Chạy Local Agent một dòng lệnh, cho AI 'ngủ mơ' lúc 3h sáng

CraftBot xuất hiện trên Product Hunt với 186 upvotes, tuyên bố giải quyết triệt để 'nỗi đau' của anh em xài OpenClaw bằng tính năng tối ưu token và quản lý bộ nhớ ma giáo.

19 thg 44 phút đọc
Đọc tiếp →
computer, technology, future, robot, light, futuristic, woman, room, hacker, security, code, cyber, coding, matrix, hacking, programming, digital, network, ai generated, coding, coding, hacking, hacking, hacking, programming, programming, programming, programming, programming
AI & AutomationCông nghệ

Qwen3.6-Plus trình làng: Cú tát thẳng mặt hay thằng đệ đắc lực cho anh em Dev?

Qwen3.6-Plus vừa ra mắt với context 1 củ, tự đọc UI đẻ code frontend như máy khâu. Anh em dev chuẩn bị ra đê ở hay sắp rảnh nợ? Cùng mổ xẻ nhé.

3 thg 43 phút đọc
Đọc tiếp →
sci-fi, interface, design, technology, 3d, render, display, colorful, screen, robotics, future
Công nghệAI & Automation

Google Stitch 2.0: Gõ phím đẻ UI, Frontend Dev có đang chuẩn bị ra chuồng gà?

Google vừa thả xích Stitch 2.0 - con AI thiết kế UI từ text và voice. Đồ chơi xịn xò cho Founder hay cú lừa đau đớn cho dân Frontend? Anh em vào hóng drama nhé!

19 thg 34 phút đọc
Đọc tiếp →