Fish Audio S2 chính thức lên sóng, vả mặt mấy pháp sư lùa gà bằng hàng Open Source xịn xò. Đưa prompt kiểu [thở dài], [cười khẩy] vào AI voice chưa bao giờ mượt thế.

Dạo này anh em lướt top tóp hay nhận điện thoại chắc cũng rén rén cái trò giả giọng lừa đảo rồi đúng không? Cảnh báo luôn là từ nay anh em sẽ còn phải đa nghi hơn cái Tào Tháo, vì Fish Audio vừa thả xích con quái vật S2. Đ*o phải mấy cái tool AI đọc văn bản đều đều như máy tụng kinh ngày xưa đâu, con này nó biết nhấn nhá, khóc lóc, cười cợt y như thật.
Ngắn gọn cho anh em lười đọc: Team Fish Audio vừa đem con S2 (Text-to-Speech thế hệ mới) lên Product Hunt. Và điểm ăn tiền nhất? Bọn họ Open-Source (mã nguồn mở) sạch sẽ sành sanh.
Anh em check qua mấy hệ quả khi bọn này thả xích S2:
[cười mỉm], [thì thầm] hay [thở dài ngao ngán] thẳng vào text, và con AI sẽ xuất ra đúng cái thái độ lồi lõm đó.Khen thì nhiều, nhưng cộng đồng dev thì anh em biết rồi đấy, cái gì cũng phải lôi ra soi mớ bug ẩn.
Nói đi cũng phải nói lại, việc Fish Audio S2 được open-source là một cú tát thẳng mặt mấy startup đang định xây "walled garden" (vườn kín) thu phí API cắt cổ. Anh em dev giờ đ*o cần phải nạp tiền cúng cho tư bản nữa, cứ ôm code về, thuê con máy chủ rẻ rẻ rồi tự host mà quậy.
Tuy nhiên, có bài học sương máu cho anh em làm app: Đừng bao giờ tin vào bảo mật bằng giọng nói nữa. Voice biometrics giờ là dĩ vãng rồi. Clone có 10s thì bảo mật bằng niềm tin.
Cho anh em nào muốn test nhân phẩm, team Fish Audio đang thả code giảm giá 50% PH-FishS2 trên trang của họ. Clone giọng sếp mà xin nghỉ phép thử xem sao (nếu toang thì C4F không chịu trách nhiệm nhé).
Nguồn hóng hớt: Product Hunt - Fish Audio S2