
Anh em làm dev dạo này chắc không lạ gì cái trend đẻ AI Agent. Công nhận lúc code ở local, mớm mấy cái prompt, nối vài cái API thấy nó chạy ầm ầm sướng rơn người. Nhưng cuộc đời đo như mơ, cứ hễ ném lên production là y như rằng toang cmnl. Cái thốn nhất là ngồi nhìn log truyền thống mà đo hiểu con bot nó đang nghĩ cái quái gì, kẹt ở tool nào, hay tự nhiên ngáo đá gọi API vô tội vạ. Khóc ròng!
Ông thần Sina - founder của PandaProbe vừa bế con hàng của mình lên Product Hunt và ăn ngay top vote. Dành cho anh em lười đọc, PandaProbe là một nền tảng open-source chuyên trị cái bệnh "mù tịt" khi anh em vận hành AI Agent.
Mục tiêu của nó rất thực dụng: Kéo anh em ra khỏi cái văn mẫu "Code chạy mượt trên máy em", chuyển sang phase "Tôi nắm trùm production, biết chính xác con AI nó đang làm trò mèo gì".
Nó cung cấp cho anh em 4 đồ chơi chính:
Bài launch nhận được khá nhiều luồng ý kiến, đa phần là anh em dev vào kêu ca nỗi khổ chung.
Hội chứng sợ lộ Data: Một lão đạo hữu tên y_taka vỗ đùi đánh đét vì PandaProbe là open-source. Tức là anh em có thể ôm bộ code về tự cài lên con vps nội bộ của công ty, giữ rịt lấy data nhạy cảm của khách hàng mà không sợ rò rỉ. Sina cũng confirm luôn là hàng nhà trồng, hỗ trợ custom tracing từ API raw cho tới các framework chuẩn.
Hố đen của sự thấu hiểu: Tài khoản igorsorokinua chốt một câu nhức nách: Cái khoảng cách từ "code chạy được" tới "hiểu nó chạy kiểu đ*o gì" là một hố đen vũ trụ của giới AI hiện tại chưa ai lấp nổi.
Combat về độ cắn tiền và "Drift": Cao trào nằm ở comment của vincentf. Lão này bắt trúng bệnh: Lỗi production đau nhất đ*o phải là crash, mà là con bot từ từ "ngu" đi (drift) sau 50 lần trả lời. Lão thắc mắc: Chấm điểm liên tục (Eval) thì tiền nuôi tool khéo còn tốn hơn tiền gọi API inference. Sina phản đòn cực khét, lôi luôn cái research paper (TRACER) mà chả tự viết ra để chứng minh: PandaProbe đánh giá theo cả một chuỗi hành động (trajectory) chứ không check lẻ tẻ từng câu, đồng thời có cơ chế lấy mẫu (sampled) để anh em đỡ phải bán nhà trả tiền server.
Hội Fan boy MCP: Nhiều anh em hỏi thăm vụ tích hợp MCP tool. Hàng nhà Sina hỗ trợ native luôn cho LangGraph với CrewAI, còn chơi custom thì cứ táng decorator vào là chạy.
Tóm cái váy lại, đừng quá tự tin vào dăm ba con AI khi chạy local. Đưa Agent lên production mà không có hệ thống Observability (khả năng quan sát) thì chẳng khác nào bịt mắt lái siêu xe tốc độ cao trên cao tốc.
Cái hay của PandaProbe là nó open-source. Anh em dev nghèo cứ việc clone về vọc vạch, chọc ngoáy xem cách người ta build hệ thống tracking LLM như thế nào. Học được cách kiểm soát Agent còn đáng giá hơn vạn lần ngồi cắm đầu viết thêm prompt. Thử đi các đồng đạo, biết đâu lại cứu được mấy pha cháy RAM sập server cuối tuần.
Nguồn: Product Hunt - PandaProbe
Code AI Agent chạy ầm ầm trên máy em nhưng lên production thì dở chứng? Cùng soi PandaProbe - tool open-source giúp anh em không còn mù tịt khi đọc log AI.