Review sương sương con hàng MolmoAct 2 từ Ai2. Điều khiển robot 2 tay không cần fine-tune, đính kèm 700 giờ dataset free cho anh em ML tha hồ cày cuốc.

Chào anh em đồng đạo. Lại là tôi đây, sau những giờ gánh bug còng lưng thì nay lượn lờ Product Hunt kiếm chút drama công nghệ để chém gió với các ông. Nay tôi bắt được một con hàng khá là ảo ma canada có tên là MolmoAct 2. Dành cho anh em nào đam mê AI và nghịch robot hay đang chán code web muốn chuyển sang gõ lệnh cho tay máy thì bơi hết vào đây.
Nói vuông cho nó nhanh, MolmoAct 2 là một con Open Action Reasoning Model (Mô hình suy luận hành động mã nguồn mở) do mấy pháp sư bên Allen Institute of Artificial Intelligence (Ai2) nặn ra. Nó có khả năng suy luận trong không gian 3D trước khi ra lệnh cho robot hành động.
Điểm ăn tiền của con này so với mấy model "lùa gà" khác trên thị trường là:
Đấy, anh em muốn làm AI thì không lo thiếu gạo để nấu cơm nữa nhé.
Trên Product Hunt, dân tình đang bàn tán khá rôm rả. Mình tổng hợp sương sương mấy luồng ý kiến chính cho anh em lười đọc:
1. Phe pháp sư cuồng Open-Source thả tim kịch liệt Đa số anh em ML engineer đều vỗ tay rào rào cho cái dataset 700 giờ. Việc Ai2 public toàn bộ data, kèm theo các bộ setup camera đa dạng, biến thể instruction (được label lại từ 71k lên 146k để chịu được mấy câu lệnh sai ngữ pháp của người dùng) khiến model generalise cực tốt ra môi trường thực tế.
2. Thanh niên thực dụng nghi ngờ nhân sinh Một bro thì đặt câu hỏi rất chí mạng: "Ê thế dataset này có lưu mấy ca 'toang' (failure cases) không, hay toàn video thành công mĩ mãn?". Chẩn cmnl các ông ạ! Tranning AI cũng như đào tạo intern vậy, phải cho nó thấy bug để nó còn biết đường né. Nếu chỉ nạp toàn ca success thì lúc thả ra đời thực, lỡ rớt cái cốc nó đơ ra không biết xử lý sao thì sập server.
3. Phe công nghiệp vỗ đùi đen đét Mấy lão quái làm việc với industrial robots (robot công nghiệp) thì lại khoái chí ở một góc độ khác. Việc train cho mấy con cánh tay robot xử lý trò inverse kinematics (động học ngược) là một mớ bòng bong toán học cực kỳ hãm tài. Giờ có cái base model này thì mọi thứ dễ thở hơn rất nhiều.
Cái vụ AI robotics này không còn là bánh vẽ trên giấy nữa anh em ạ. Nhưng qua vụ này, chúng ta rút ra một chân lý bất diệt: Data > Algorithm (Dữ liệu ngon quan trọng hơn Thuật toán xịn).
Dù anh em có viết code xịn xò đến mấy, build model phức tạp cỡ nào mà data đầu vào như hạch (hoặc đ*o có data) thì sản phẩm cuối cùng cũng vứt. Hành động open-source data của Ai2 rất đáng hoan nghênh, tát thẳng mặt những gã khổng lồ đang muốn độc quyền hóa ngành robot học.
Anh em nào rảnh rỗi hoặc đang muốn đổi gió thì clone về ngâm cứu đi. Biết đâu năm sau lại tự build được con robot biết bưng bia rót mồi cho mình ngồi code. Chúc anh em trơn tru không dính bug!
Nguồn tham khảo: