Claude Code Pro Max bóp quota: Dev gào thét trên GitHub

Đang hì hục fix bug giữa đêm, định nhờ con AI gánh hộ đoạn logic chuối cả nải thì tự nhiên nó lăn ra báo "Hết hạn mức". Ơ kìa? Bỏ tiền mua gói Pro Max đàng hoàng, vừa mới múa phím được tiếng rưỡi đã cạn cmn mana. Ảo ma thật sự các ông ạ!

Bỏ tiền mua Pro Max mà xài như tài khoản Free: Rốt cuộc chuyện quái gì đang xảy ra?

Dạo một vòng Hacker News hôm nay, đập ngay vào mắt tôi là quả thread to đùng đỏ chót dắt link sang GitHub Issue #45756 của nhà Anthropic (cụ thể là cái tool Claude Code). Tiêu đề thì sặc mùi cay cú: "Pro Max 5x quota exhausted in 1.5 hours despite moderate usage" (Gói Pro Max x5 quota bay màu trong 1 tiếng rưỡi dù chỉ xài sương sương).

Anh em hiểu cảm giác này không? Giống như bạn mua vé buffet VIP, lấy được dĩa tôm hùm đầu tiên thì quản lý nhà hàng ra vỗ vai bảo: "Anh ơi nhà hàng hết đồ rồi, mời anh ra về". Tác giả cái issue bảo mình chỉ dùng ở mức độ "moderate" (vừa phải), không spam, không generate hàng vạn dòng code, thế quái nào cái quota gấp 5 lần người thường lại bốc hơi lẹ thế?

Dân tình Hacker News tế sống hệ thống rate limit

Cái thread gom được hơn 600 upvote trên HN trong thời gian ngắn là đủ hiểu anh em dev đồng cảm và cay cú cỡ nào. Giang cư mận bắt đầu chia phe combat và bóc phốt cơ chế của con hàng Claude Code này.

Có vài luồng quan điểm đang chiếm sóng:

Thứ nhất, "Treo đầu dê bán thịt chó": Nhiều đạo hữu cho rằng cái nhãn "Pro Max" chỉ là bánh vẽ. Cứ tưởng mua gói to là làm trùm, ai dè gặp rate limit nó tát cho không trượt phát nào. Đã thu tiền premium thì hạ tầng phải đáp ứng được, đằng này sập tiệm cấm chat luôn.

Thứ hai, bí ẩn đằng sau cái "Context Window": Một vài pháp sư ẩn danh soi ra vấn đề cốt lõi. Mấy cái CLI tool dạng này (như Claude Code) nó rất ma giáo. Mỗi lần bạn gõ một câu hỏi ngắn tí, nó sẽ âm thầm đính kèm (inject) cả mớ file, cây thư mục, và context của project để AI hiểu. Bạn tưởng bạn gửi đi 100 tokens? Không đâu, nó cắn của bạn 100,000 tokens đấy! Ngốn quota lẹ là do cái này.

Thứ ba, hệ thống có nhả lại nhưng... như hạch: Lão quái oditogre (một user trên HN) comment báo tin vui lẫn tin buồn: "Hệ thống chạy lại rồi nha anh em. Nhưng mà cảnh báo trước, tôi mới thử hồi nãy, thời gian load giữa các câu hỏi lâu vãi linh hồn (có lúc gần cả phút)." Vãi cả chưởng, phản hồi mất 1 phút thì khác đ*o gì chạy model bằng vps cùi bắp không? Mất hết cả flow code.

Góc nhìn từ Coding4Food: Bài học sinh tồn cho hệ chơi AI

Drama này chốt lại cho anh em mình vài bài học xương máu khi đu trend mấy cái ai tools mới nổi:

Đừng bao giờ tin cái mác "Unlimited" hay "Pro Max": Trữ lượng GPU của bọn Big Tech cũng có giới hạn. Lúc cao điểm thì mày là bố mày cũng bị bóp băng thông thôi.
Hiểu rõ tool mình đang xài: Dùng AI tích hợp thẳng vào IDE hay CLI thì phải xem tài liệu xem nó gửi cái gì đi. Nhớ config .claudesignore hoặc .cursorignore đàng hoàng, đừng để nó bê cả thư mục node_modules hay mấy file log rác rưởi quăng lên server. Cạn token oan uổng ráng chịu.
Luôn có backup: Đừng bao giờ all-in vào 1 con AI. Claude sập thì quay xe sang ChatGPT, DeepSeek, hoặc phi thẳng lên StackOverflow như các bậc tiền bối ngày xưa. Quá lệ thuộc là toang!

Thôi, tôi lại quay về fix tiếp con bug đây. Đợi AI load 1 phút chắc sếp tế sống tôi trước khi Anthropic đền bù.

Nguồn hóng hớt:

Hacker News: https://news.ycombinator.com/item?id=...
GitHub Issue gốc: https://github.com/anthropics/claude-code/issues/45756

Bỏ tiền mua Pro Max mà xài như tài khoản Free: Rốt cuộc chuyện quái gì đang xảy ra?

Dân tình Hacker News tế sống hệ thống rate limit

Có vài luồng quan điểm đang chiếm sóng:

Góc nhìn từ Coding4Food: Bài học sinh tồn cho hệ chơi AI

Drama này chốt lại cho anh em mình vài bài học xương máu khi đu trend mấy cái ai tools mới nổi:

Đừng bao giờ tin cái mác "Unlimited" hay "Pro Max": Trữ lượng GPU của bọn Big Tech cũng có giới hạn. Lúc cao điểm thì mày là bố mày cũng bị bóp băng thông thôi.

Hiểu rõ tool mình đang xài: Dùng AI tích hợp thẳng vào IDE hay CLI thì phải xem tài liệu xem nó gửi cái gì đi. Nhớ config .claudesignore hoặc .cursorignore đàng hoàng, đừng để nó bê cả thư mục node_modules hay mấy file log rác rưởi quăng lên server. Cạn token oan uổng ráng chịu.

Luôn có backup: Đừng bao giờ all-in vào 1 con AI. Claude sập thì quay xe sang ChatGPT, DeepSeek, hoặc phi thẳng lên StackOverflow như các bậc tiền bối ngày xưa. Quá lệ thuộc là toang!

Thôi, tôi lại quay về fix tiếp con bug đây. Đợi AI load 1 phút chắc sếp tế sống tôi trước khi Anthropic đền bù.

Nguồn hóng hớt:

Bỏ tiền mua Claude Pro Max: Chọt 1 tiếng rưỡi hết quota, Dev khóc ròng tế sống Anthropic

Bỏ tiền mua Pro Max mà xài như tài khoản Free: Rốt cuộc chuyện quái gì đang xảy ra?

Dân tình Hacker News tế sống hệ thống rate limit

Góc nhìn từ Coding4Food: Bài học sinh tồn cho hệ chơi AI

Bình luận

Bỏ tiền mua Pro Max mà xài như tài khoản Free: Rốt cuộc chuyện quái gì đang xảy ra?

Dân tình Hacker News tế sống hệ thống rate limit

Góc nhìn từ Coding4Food: Bài học sinh tồn cho hệ chơi AI

Bài viết liên quan

Chính phủ Mỹ 'khóa mõm' Fable 5 và Mythos 5, Anthropic quay xe khét lẹt làm dev ngã ngửa

Claude Fable 5 Thả Xích: Siêu AI 'Hủy Diệt' Mới Hay Lại Là Cú Lùa Gà Benchmark?

Show HN Đang "Ngạt Thở" Vì Rác AI? Cuộc Chiến Giữa "Vibe Coding" Và Dev Thuần

Thinking Machines ra mắt Inkling: Thêm một model AI 'Mở Trọng Số' xịn xò, anh em dev lại có đồ chơi tự host?

Tắt văn mẫu 'Load-Bearing' của Claude: Khi AI bỗng dưng nghiện dùng từ lóng và cách anh em dev 'khóa mõm' nó

Xem AI Agent gõ code, chạy CLI trực quan bằng... Robot 3D: Game hóa việc debug hay vẽ chuyện?