Đội Đỏ AMD vừa tung ra Lemonade - con server local LLM open-source xài cả GPU lẫn NPU. Liệu có đủ tuổi đấm mồm được CUDA của Nvidia hay lại vỡ mộng?

Anh em dev dạo này chắc cũng rát ví vì cúng tiền cho API của OpenAI, hoặc khóc ròng nhìn cái giá trên trời của mấy con card xanh lá (Nvidia) rồi đúng không? Cơ mà khoan, Đội Đỏ (AMD) vừa chính thức thắp lên tí hy vọng với một con hàng mới toanh mang tên Lemonade. Để xem lần này AMD cho anh em uống nước chanh thật, hay lại bắt nhai vỏ chanh đắng ngắt nhé.
Nói nhanh cho nó vuông, Lemonade là một dự án open-source (mã nguồn mở) giúp anh em dựng một local LLM server siêu tốc. Điểm "ảo ma" nhất của con hàng này là nó được tối ưu để chạy trên cả GPU lẫn NPU (Neural Processing Unit - mấy cái lõi xử lý AI mà dạo này hãng nào cũng nhét vào CPU rồi quảng cáo rầm rộ ấy).
Thay vì phải đi thuê máy chủ cắn răng trả phí hàng tháng để chạy model, giờ đây nếu anh em đang xài hàng của AMD, Lemonade hứa hẹn sẽ vắt kiệt sức mạnh phần cứng của các ông để chạy LLM mượt mà ngay trên máy cá nhân. Viết bằng ngôn ngữ gì, tối ưu ra sao thì anh em lên repo đọc thêm, nhưng động thái này cho thấy AMD đang cực kỳ nỗ lực vá cái lỗ hổng to đùng về software để khô máu với hệ sinh thái CUDA của Nvidia.
Dù là kèo thơm nhưng với cái "tiền án" làm software hên xui của AMD, cộng đồng mạng cũng chia phe combat nảy lửa lắm:
Từ vụ Lemonade này, rút ra vài thứ hay ho cho anh em:
Nói chung, hoan hô AMD. Nước chanh này ngon hay dở thì thời gian (và số lượng bug trên Github) sẽ trả lời!
Nguồn hóng hớt: Lemonade Server AI