
Mấy ông thần code dạo đâu rồi, dậy mà xem "Idol giới AI" Andrej Karpathy lại vừa làm cái trò gì này.
Chuyện là sau một thời gian ở ẩn tu luyện (hoặc đi du lịch đâu đó không ai biết), cụ Karpathy lại vừa thả xích một project mới toanh tên là MicroGPT. Không phải là bom tấn nghìn tỷ tham số như GPT-4 hay Claude, mà là một con hàng... bé tí hin. Đúng như cái tên, nghe là thấy "nhỏ nhưng có võ" rồi.
Nói ngắn gọn cho anh em đỡ phải google: MicroGPT về cơ bản là một phiên bản tối giản hóa của kiến trúc GPT. Mục đích không phải để các ông đem về build app chat sex hay viết content lùa gà, mà cốt lõi là giáo dục.
Project này giống như kiểu thay vì đưa cho anh em một chiếc Ferrari đóng kín nắp capo, Karpathy đưa cho anh em bộ Lego Technic để tự lắp ráp từng cái bánh răng engine vậy. Code cực sạch, license MIT (xài thoải mái con gà mái), và quan trọng là nó chạy được.
Trên GitHub, dân tình đang bàn tán xôn xao. Có ông hỏi thẳng: "Ủa rồi cái này dùng case nào (use case) ngon nhất?".
Câu trả lời nhận được nghe trớt quớt nhưng lại thâm thúy vãi nồi: "Dự án nghệ thuật thôi (Art project)".
Nói thế chứ dân chuyên nhìn vào là biết ngay đây là hàng xịn để học cách một con LLM (Large Language Model) thực sự vận hành từ trong ra ngoài, chứ không phải chỉ biết gọi API như mấy tay "AI Engineer" nửa mùa.
Lướt qua phần comment của Hacker News, không khí cũng xôm tụ phết. Có thể chia làm mấy luồng tư tưởng chính:
Từ vụ này, tôi thấy có mấy cái hay ho anh em nên ghim lại:
Túm cái váy lại: Anh em nào muốn update kiến thức AI mà sợ ngộp trong đống paper học thuật thì clone repo về vọc ngay đi. Vừa sang mồm khoe "tao đang nghiên cứu architecture GPT", vừa không tốn xu nào.
Andrej Karpathy vừa release MicroGPT. Giang hồ đồn là "art project" nhưng thực chất là kho báu cho anh em muốn hiểu sâu về LLM mà không cần đốt tiền mua GPU.