Coding4Food LogoCoding4Food
Trang chủChuyên mụcĐã lưu
en
Coding4Food LogoCoding4Food
Trang chủChuyên mụcĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
AI & AutomationCông nghệ

Đừng tin vào lỗ tai mình nữa: Fish Audio S2 ra mắt, clone giọng người yêu cũ chỉ trong 10s

11 tháng 3, 20264 phút đọc

Fish Audio S2 chính thức lên sóng, vả mặt mấy pháp sư lùa gà bằng hàng Open Source xịn xò. Đưa prompt kiểu [thở dài], [cười khẩy] vào AI voice chưa bao giờ mượt thế.

Chia sẻ bài viết:
podcast, microphone, audio, music, concept, sound, waves, media, podcast, podcast, podcast, podcast, podcast
Nguồn gốc: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-aiNguồn gốc: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai
Nguồn gốc: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-aiNguồn gốc: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai
fish audio s2ai voicemã nguồn mởclone giọng 10stext-to-speech aisglang
Chia sẻ bài viết:

Bình luận

Dạo này anh em lướt top tóp hay nhận điện thoại chắc cũng rén rén cái trò giả giọng lừa đảo rồi đúng không? Cảnh báo luôn là từ nay anh em sẽ còn phải đa nghi hơn cái Tào Tháo, vì Fish Audio vừa thả xích con quái vật S2. Đ*o phải mấy cái tool AI đọc văn bản đều đều như máy tụng kinh ngày xưa đâu, con này nó biết nhấn nhá, khóc lóc, cười cợt y như thật.

Rốt cuộc thì chuyện quái gì vừa xảy ra?

Ngắn gọn cho anh em lười đọc: Team Fish Audio vừa đem con S2 (Text-to-Speech thế hệ mới) lên Product Hunt. Và điểm ăn tiền nhất? Bọn họ Open-Source (mã nguồn mở) sạch sẽ sành sanh.

Anh em check qua mấy hệ quả khi bọn này thả xích S2:

  • Prompt bằng ngôn ngữ tự nhiên: Anh em có thể gõ [cười mỉm], [thì thầm] hay [thở dài ngao ngán] thẳng vào text, và con AI sẽ xuất ra đúng cái thái độ lồi lõm đó.
  • Clone giọng tốc độ bàn thờ: Tác giả mạnh miệng gáy chỉ cần 10 giây thu âm (audio sạch xíu) là đủ để AI mượn luôn cái thanh quản của anh em.
  • Đa ngôn ngữ: Hỗ trợ hơn 80 thứ tiếng. Tiếng Nhật, Anh, Trung là Tier 1, nhưng yên tâm là có cả tiếng Việt (vi) cho anh em tha hồ chế meme.
  • Tech stack khét lẹt: Đứng sau chống lưng là SGLang. S2 không thèm xài mấy cái kiến trúc cũ như So-VITS-SVC nữa, mà chơi hẳn mô hình ngôn ngữ lớn (LLM) đập vào token âm thanh rời rạc.

Giang cư mận cào phím gì trên Product Hunt?

Khen thì nhiều, nhưng cộng đồng dev thì anh em biết rồi đấy, cái gì cũng phải lôi ra soi mớ bug ẩn.

  • Team "Vọc vạch IoT": Có thanh niên hỏi ngay "Ê tao ném cái này vào Raspberry Pi làm trợ lý ảo ở nhà thay con vợ cằn nhằn được không?". Tác giả rep luôn: Múc! Có tích hợp sẵn Home Assistant rồi anh em ạ.
  • Team "Pháp sư soi code": Một đạo hữu có nick mordrag vào hỏi xoáy ngay: "Làm sao giữ được cảm xúc xuyên suốt đoạn văn dài? Và cái vẹo gì khiến mày tự tin ăn đứt So-VITS-SVC?". Team dev từ tốn giải thích nhờ trò tokenize audio và pre-train data khủng nên 10-15s là đủ neo được đặc trưng giọng nói.
  • Team "Bắt lỗi": Có người tỉnh đòn liền phản biện: "Gáy 10s clone giọng nghe thì oai đấy, nhưng tao cá là đưa mấy giọng nặng accent (giọng địa phương) hay giọng thều thào vào là bể form ngay". Chỗ này thì đụng trúng chỗ ngứa, vì prosody (ngữ điệu) của mấy ca khó luôn là tử huyệt của AI voice.
  • Team "Đạo đức mạng": "Giọng AI giờ ảo ma thế này, thế các anh tính sao về bản quyền giọng nói, sự đồng thuận và lừa đảo deepfake?". Một câu hỏi chí mạng... và anh em đoán xem? Team dev lặn cmn mất, chưa thấy rep. Chắc đang bận fix hotfix.

Góc nhìn từ lão quái C4F & Bài học sinh tồn

Nói đi cũng phải nói lại, việc Fish Audio S2 được open-source là một cú tát thẳng mặt mấy startup đang định xây "walled garden" (vườn kín) thu phí API cắt cổ. Anh em dev giờ đ*o cần phải nạp tiền cúng cho tư bản nữa, cứ ôm code về, thuê con máy chủ rẻ rẻ rồi tự host mà quậy.

Tuy nhiên, có bài học sương máu cho anh em làm app: Đừng bao giờ tin vào bảo mật bằng giọng nói nữa. Voice biometrics giờ là dĩ vãng rồi. Clone có 10s thì bảo mật bằng niềm tin.

Cho anh em nào muốn test nhân phẩm, team Fish Audio đang thả code giảm giá 50% PH-FishS2 trên trang của họ. Clone giọng sếp mà xin nghỉ phép thử xem sao (nếu toang thì C4F không chịu trách nhiệm nhé).


Nguồn hóng hớt: Product Hunt - Fish Audio S2

Bài viết liên quan

AI đang 'bóp chết' Copyleft: Hợp pháp thì đ*o sai, nhưng có hợp tình?
Công nghệDrama IT

AI đang 'bóp chết' Copyleft: Hợp pháp thì đ*o sai, nhưng có hợp tình?

Drama cực căng trên Hacker News: AI cào mã nguồn mở, xào nấu lại để né bản quyền GPL. Cuộc chiến giữa luật pháp và đạo đức giới open-source.

10 thg 34 phút đọc
Đọc tiếp →
iphone, hand, screen, smartphone, apps, mobile phone, cell phone, phone, communication, mobile, telephone, technology, cellular, wireless, modern, digital, communicate, electronic, display, contact, touch, touchscreen, applications, ios, apple, iphone, iphone, iphone, iphone, iphone, smartphone, mobile phone, cell phone, phone, phone, phone, mobile, mobile
Drama ITCông nghệ

Drama Android 'chốt cửa': Google tính biến hệ điều hành quốc dân thành 'Temu iOS'?

Hóng drama Google siết chặt Android, bóp nghẹt cài đặt app ngoài (sideload) và F-Droid. Dev thế giới thi nhau tế sống, kêu gọi EU vào cuộc.

21 thg 25 phút đọc
Đọc tiếp →