Claude 4.7 xịn thì xịn thật, nhưng có ai để ý cái tokenizer mới nó tính tiền anh em thế nào không? Cùng xem một pháp sư HN mổ xẻ chi phí thực tế.

Anh em ạ, dạo này cõi mạng đang rần rần vụ Anthropic ném quả bom Claude 4.7 vào mặt OpenAI. Dân tình khen nức nở độ mượt, nhưng có một cú twist mà dân gõ phím ít để ý: cái bill API. Mới đây một pháp sư trên Hacker News đã lôi cái tokenizer của Claude 4.7 ra mổ xẻ xem rốt cuộc nó đang "cắn" tiền của anh em thế nào.
Tóm tắt nhanh cho anh em lười đọc: Tokenizer nôm na là cái máy băm chữ của AI. Bạn quăng vào một đoạn text, nó băm thành các "token" rồi tính tiền trên số lượng đó. Lão tác giả trên Claude Code Camp rảnh rỗi sinh nông nổi, lôi một đống text và code ra test để xem tỷ lệ nén của Claude 4.7 ra sao.
Sự thật là, khi mấy hãng update model, họ cũng âm thầm chỉnh lại cái "máy băm" này. Tỷ lệ nén tốt hơn thì anh em đỡ tốn tiền, nhét được nhiều context hơn. Nhưng nếu tỷ lệ nén ngu đi (đặc biệt với mớ code chằng chịt ký tự đặc biệt), thì chúc mừng, anh em đang bị "lùa gà" hợp pháp. Lão tác giả chỉ ra rằng, chi phí thực tế phụ thuộc cực mạnh vào cái bạn ném cho nó là văn bản tiếng Anh hay là một cục code rác. Anh em xài mấy AI tools gen code tự động thì cứ cẩn thận check lại bill cuối tháng.
Topic này kéo về gần 600 points trên HN, chứng tỏ động chạm đến bát cơm của rất nhiều lão quái. Dạo một vòng thì thấy chia làm mấy phe chính:
Tóm cái váy lại, đừng bao giờ tin vào mấy cái thông số marketing hào nhoáng "giá rẻ hơn X%". Cái đó là họ tính trên văn bản tiêu chuẩn, còn anh em ném code C++ hay một nùi JSON lộn xộn vào thì câu chuyện nó đi xa lắm.
Bài học sinh tồn: Trước khi đem model mới tích hợp vào system công ty chạy production, hãy làm ơn viết script test thử cost trên chính data của mình. Tối ưu hóa prompt, cắt bớt mấy câu thảo mai thừa thãi đi (kiểu "hi AI, please help me..."). Đừng để đến cuối tháng, app thì chưa có doanh thu mà tiền API đã báo động đỏ.