Bỏ tiền mua gói Pro Max của Claude nhưng mới gõ code được 1.5 tiếng đã cạn mana. Cùng hóng biến GitHub issue 45756 đang làm anh em dev sôi máu.

Đang hì hục fix bug giữa đêm, định nhờ con AI gánh hộ đoạn logic chuối cả nải thì tự nhiên nó lăn ra báo "Hết hạn mức". Ơ kìa? Bỏ tiền mua gói Pro Max đàng hoàng, vừa mới múa phím được tiếng rưỡi đã cạn cmn mana. Ảo ma thật sự các ông ạ!
Dạo một vòng Hacker News hôm nay, đập ngay vào mắt tôi là quả thread to đùng đỏ chót dắt link sang GitHub Issue #45756 của nhà Anthropic (cụ thể là cái tool Claude Code). Tiêu đề thì sặc mùi cay cú: "Pro Max 5x quota exhausted in 1.5 hours despite moderate usage" (Gói Pro Max x5 quota bay màu trong 1 tiếng rưỡi dù chỉ xài sương sương).
Anh em hiểu cảm giác này không? Giống như bạn mua vé buffet VIP, lấy được dĩa tôm hùm đầu tiên thì quản lý nhà hàng ra vỗ vai bảo: "Anh ơi nhà hàng hết đồ rồi, mời anh ra về". Tác giả cái issue bảo mình chỉ dùng ở mức độ "moderate" (vừa phải), không spam, không generate hàng vạn dòng code, thế quái nào cái quota gấp 5 lần người thường lại bốc hơi lẹ thế?
Cái thread gom được hơn 600 upvote trên HN trong thời gian ngắn là đủ hiểu anh em dev đồng cảm và cay cú cỡ nào. Giang cư mận bắt đầu chia phe combat và bóc phốt cơ chế của con hàng Claude Code này.
Có vài luồng quan điểm đang chiếm sóng:
Thứ nhất, "Treo đầu dê bán thịt chó": Nhiều đạo hữu cho rằng cái nhãn "Pro Max" chỉ là bánh vẽ. Cứ tưởng mua gói to là làm trùm, ai dè gặp rate limit nó tát cho không trượt phát nào. Đã thu tiền premium thì hạ tầng phải đáp ứng được, đằng này sập tiệm cấm chat luôn.
Thứ hai, bí ẩn đằng sau cái "Context Window": Một vài pháp sư ẩn danh soi ra vấn đề cốt lõi. Mấy cái CLI tool dạng này (như Claude Code) nó rất ma giáo. Mỗi lần bạn gõ một câu hỏi ngắn tí, nó sẽ âm thầm đính kèm (inject) cả mớ file, cây thư mục, và context của project để AI hiểu. Bạn tưởng bạn gửi đi 100 tokens? Không đâu, nó cắn của bạn 100,000 tokens đấy! Ngốn quota lẹ là do cái này.
Thứ ba, hệ thống có nhả lại nhưng... như hạch: Lão quái oditogre (một user trên HN) comment báo tin vui lẫn tin buồn: "Hệ thống chạy lại rồi nha anh em. Nhưng mà cảnh báo trước, tôi mới thử hồi nãy, thời gian load giữa các câu hỏi lâu vãi linh hồn (có lúc gần cả phút)." Vãi cả chưởng, phản hồi mất 1 phút thì khác đ*o gì chạy model bằng vps cùi bắp không? Mất hết cả flow code.
Drama này chốt lại cho anh em mình vài bài học xương máu khi đu trend mấy cái ai tools mới nổi:
.claudesignore hoặc .cursorignore đàng hoàng, đừng để nó bê cả thư mục node_modules hay mấy file log rác rưởi quăng lên server. Cạn token oan uổng ráng chịu.Thôi, tôi lại quay về fix tiếp con bug đây. Đợi AI load 1 phút chắc sếp tế sống tôi trước khi Anthropic đền bù.
Nguồn hóng hớt: