Sự Thật Lượng Token Bị Hao Hụt Của Opus 4.6 và 4.7

Đang ngồi húp bát mì tôm cuối tháng, lướt Hacker News thì tôi thấy quả post chễm chệ top với hơn 500 upvote: "Anonymous request-token comparisons from Opus 4.6 and Opus 4.7". Đọc cái tít mà lú luôn anh em ạ. AI dạo này đẻ version nhanh hơn cả nyc thay người yêu, anh em đang xài Claude 3 Opus mà tự nhiên lòi đâu ra quả data của Opus 4.6 với 4.7 thế này? Chắc chắn là hàng nội bộ bị leak hoặc mấy pháp sư test ngầm rồi.

Tóm tắt nhanh cho anh em lười đọc: Bảng phong thần bú Token

Cụ thể thì lão Bill Chambers vừa tung ra một cái leaderboard chuyên bóc phốt lượng request-token ẩn danh. Cho anh em nào chưa rành, thì đây là trò đo đếm xem các phiên bản AI (ở đây là các bản update của dòng Opus) nó "cắn" token như thế nào qua từng đợt.

Thay vì nghe mấy pháp sư tư bản PR lùa gà là "model bản mới xịn xò con bò, code mượt, tối ưu cost", thì trang này nó lấy log thực tế ra đập vào mặt. Đại khái là đo xem cùng một prompt, con nào xài hao token hơn. Nhìn vào cái bảng này, anh em dev AI biết ngay tháng sau AWS hay bill API có làm thủng ví hay không. Rất ma giáo nhưng cực kỳ thiết thực!

Giang cư mận đang tế sống ai?

Dạo một vòng các động IT, giang hồ đang chia phe combat nảy lửa về vụ này. Tôi tóm tắt lại cho các ông mấy luồng ý kiến chiếm sóng nhất:

Phe "Sốc ví": Đa số anh em đều than trời vì nhìn lượng token bị thổi phồng ngầm. Có vẻ như model càng "thông minh" thì nó càng nói dai, nói dài, và nói tốn tiền. Vài anh em bảo: "Má, gọi API có cái function cỏ mà nó trả về cái sớ dài như bài văn tế!".
Phe "Thuyết âm mưu": Một vài đạo hữu ẩn danh thì lại thả mìn thuyết âm mưu. Các lão quái này cho rằng mấy hãng AI lớn thi thoảng cố tình tinh chỉnh (nerf/buff) ẩn để ép người dùng xài nhiều token hơn. Tóm lại là chiêu trò vặt lông vịt của tư bản.
Phe "Thực dụng": Kệ m* version mấy, cứ con nào code ngon, ít bug, giải quyết được task mà cost trong tầm kiểm soát là quất. Mấy ông này khuyên anh em nên hốt một con VPS tự deploy mấy model open-source chạy cho lành nếu sợ bill API cao bất thình lình.

Góc nhìn từ Coding4Food: Bài học sinh tồn sau vụ này

Chơi với AI thời nay đ*o khác gì đu đỉnh crypto các ông ạ. Nay nó mượt, mai hãng nó tung quả hotfix cái tự nhiên hệ thống ngáo mẹ luôn là chuyện bình thường.

Bài học xương máu từ vãn bối gửi đến anh em: Đừng bao giờ tin 100% vào tài liệu PR. Khi build các ứng dụng tích hợp LLM, nhớ làm cái cơ chế tracking token và cost cho tử tế, set rate limit đàng hoàng. Không có ngày sáng ngủ dậy thấy cái bill API 5 chữ số thì lại khóc tiếng Mán. Lười thì tốt, nhưng lười mà không có não kiểm soát thì có ngày ra đê mà code dạo nhé các đồng đạo.

Nguồn tham khảo:

Hacker News / Bảng xếp hạng Token: https://tokens.billchambers.me/leaderboard

Tóm tắt nhanh cho anh em lười đọc: Bảng phong thần bú Token

Giang cư mận đang tế sống ai?

Dạo một vòng các động IT, giang hồ đang chia phe combat nảy lửa về vụ này. Tôi tóm tắt lại cho các ông mấy luồng ý kiến chiếm sóng nhất:

Phe "Sốc ví": Đa số anh em đều than trời vì nhìn lượng token bị thổi phồng ngầm. Có vẻ như model càng "thông minh" thì nó càng nói dai, nói dài, và nói tốn tiền. Vài anh em bảo: "Má, gọi API có cái function cỏ mà nó trả về cái sớ dài như bài văn tế!".

Phe "Thuyết âm mưu": Một vài đạo hữu ẩn danh thì lại thả mìn thuyết âm mưu. Các lão quái này cho rằng mấy hãng AI lớn thi thoảng cố tình tinh chỉnh (nerf/buff) ẩn để ép người dùng xài nhiều token hơn. Tóm lại là chiêu trò vặt lông vịt của tư bản.

Phe "Thực dụng": Kệ m* version mấy, cứ con nào code ngon, ít bug, giải quyết được task mà cost trong tầm kiểm soát là quất. Mấy ông này khuyên anh em nên hốt một con VPS tự deploy mấy model open-source chạy cho lành nếu sợ bill API cao bất thình lình.

Góc nhìn từ Coding4Food: Bài học sinh tồn sau vụ này

Chơi với AI thời nay đ*o khác gì đu đỉnh crypto các ông ạ. Nay nó mượt, mai hãng nó tung quả hotfix cái tự nhiên hệ thống ngáo mẹ luôn là chuyện bình thường.

Nguồn tham khảo:

Drama 'Cắn' Token: Bóc Phốt Mức Độ Hao Tài Của Opus 4.6 vs 4.7

Tóm tắt nhanh cho anh em lười đọc: Bảng phong thần bú Token

Giang cư mận đang tế sống ai?

Góc nhìn từ Coding4Food: Bài học sinh tồn sau vụ này

Bình luận

Tóm tắt nhanh cho anh em lười đọc: Bảng phong thần bú Token

Giang cư mận đang tế sống ai?

Góc nhìn từ Coding4Food: Bài học sinh tồn sau vụ này

Bài viết liên quan

Kimi K3: Pháp sư Trung Hoa đại chiến Silicon Valley với mô hình reasoning siêu rẻ

Thinking Machines ra mắt Inkling: Thêm một model AI 'Mở Trọng Số' xịn xò, anh em dev lại có đồ chơi tự host?

Bị chém 120 củ biden cho hệ thống bowling, lão SRE 'quay xe' tự chế bằng ESP32 chỉ hết $1.600

Mừng sinh nhật 15 tuổi Recurse Center: Khi những gã điên không thèm làm 'kỳ lân' mà đi làm việc tử tế

Claude Fable 5 Thả Xích: Siêu AI 'Hủy Diệt' Mới Hay Lại Là Cú Lùa Gà Benchmark?

Bóc trần sự thật AI: Khi giang cư mận phát hiện siêu trí tuệ chỉ là 'một đống weights'