Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
en
Trang chủChuyên mụcArcadeĐã lưu
Coding4Food LogoCoding4Food
Trang chủChuyên mụcArcadeĐã lưu
Bảo mật|Điều khoản

© 2026 Coding4Food. Viết bởi dev, cho dev.

Tất cả tin tức
AI & AutomationCông nghệ

Đừng tin vào lỗ tai mình nữa: Fish Audio S2 ra mắt, clone giọng người yêu cũ chỉ trong 10s

11 tháng 3, 20264 phút đọc

Fish Audio S2 chính thức lên sóng, vả mặt mấy pháp sư lùa gà bằng hàng Open Source xịn xò. Đưa prompt kiểu [thở dài], [cười khẩy] vào AI voice chưa bao giờ mượt thế.

Chia sẻ bài viết:
podcast, microphone, audio, music, concept, sound, waves, media, podcast, podcast, podcast, podcast, podcast
Nguồn gốc: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-aiNguồn gốc: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai
Nguồn gốc: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-aiNguồn gốc: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Nội dung thuộc bản quyền Coding4Food. Original source: https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai. Content is property of Coding4Food. This content was scraped without permission from https://coding4food.com/post/fish-audio-s2-ma-nguon-mo-clone-giong-ai
fish audio s2ai voicemã nguồn mởclone giọng 10stext-to-speech aisglang
Chia sẻ bài viết:

Bình luận

Dạo này anh em lướt top tóp hay nhận điện thoại chắc cũng rén rén cái trò giả giọng lừa đảo rồi đúng không? Cảnh báo luôn là từ nay anh em sẽ còn phải đa nghi hơn cái Tào Tháo, vì Fish Audio vừa thả xích con quái vật S2. Đ*o phải mấy cái tool AI đọc văn bản đều đều như máy tụng kinh ngày xưa đâu, con này nó biết nhấn nhá, khóc lóc, cười cợt y như thật.

Rốt cuộc thì chuyện quái gì vừa xảy ra?

Ngắn gọn cho anh em lười đọc: Team Fish Audio vừa đem con S2 (Text-to-Speech thế hệ mới) lên Product Hunt. Và điểm ăn tiền nhất? Bọn họ Open-Source (mã nguồn mở) sạch sẽ sành sanh.

Anh em check qua mấy hệ quả khi bọn này thả xích S2:

  • Prompt bằng ngôn ngữ tự nhiên: Anh em có thể gõ [cười mỉm], [thì thầm] hay [thở dài ngao ngán] thẳng vào text, và con AI sẽ xuất ra đúng cái thái độ lồi lõm đó.
  • Clone giọng tốc độ bàn thờ: Tác giả mạnh miệng gáy chỉ cần 10 giây thu âm (audio sạch xíu) là đủ để AI mượn luôn cái thanh quản của anh em.
  • Đa ngôn ngữ: Hỗ trợ hơn 80 thứ tiếng. Tiếng Nhật, Anh, Trung là Tier 1, nhưng yên tâm là có cả tiếng Việt (vi) cho anh em tha hồ chế meme.
  • Tech stack khét lẹt: Đứng sau chống lưng là SGLang. S2 không thèm xài mấy cái kiến trúc cũ như So-VITS-SVC nữa, mà chơi hẳn mô hình ngôn ngữ lớn (LLM) đập vào token âm thanh rời rạc.

Giang cư mận cào phím gì trên Product Hunt?

Khen thì nhiều, nhưng cộng đồng dev thì anh em biết rồi đấy, cái gì cũng phải lôi ra soi mớ bug ẩn.

  • Team "Vọc vạch IoT": Có thanh niên hỏi ngay "Ê tao ném cái này vào Raspberry Pi làm trợ lý ảo ở nhà thay con vợ cằn nhằn được không?". Tác giả rep luôn: Múc! Có tích hợp sẵn Home Assistant rồi anh em ạ.
  • Team "Pháp sư soi code": Một đạo hữu có nick mordrag vào hỏi xoáy ngay: "Làm sao giữ được cảm xúc xuyên suốt đoạn văn dài? Và cái vẹo gì khiến mày tự tin ăn đứt So-VITS-SVC?". Team dev từ tốn giải thích nhờ trò tokenize audio và pre-train data khủng nên 10-15s là đủ neo được đặc trưng giọng nói.
  • Team "Bắt lỗi": Có người tỉnh đòn liền phản biện: "Gáy 10s clone giọng nghe thì oai đấy, nhưng tao cá là đưa mấy giọng nặng accent (giọng địa phương) hay giọng thều thào vào là bể form ngay". Chỗ này thì đụng trúng chỗ ngứa, vì prosody (ngữ điệu) của mấy ca khó luôn là tử huyệt của AI voice.
  • Team "Đạo đức mạng": "Giọng AI giờ ảo ma thế này, thế các anh tính sao về bản quyền giọng nói, sự đồng thuận và lừa đảo deepfake?". Một câu hỏi chí mạng... và anh em đoán xem? Team dev lặn cmn mất, chưa thấy rep. Chắc đang bận fix hotfix.

Góc nhìn từ lão quái C4F & Bài học sinh tồn

Nói đi cũng phải nói lại, việc Fish Audio S2 được open-source là một cú tát thẳng mặt mấy startup đang định xây "walled garden" (vườn kín) thu phí API cắt cổ. Anh em dev giờ đ*o cần phải nạp tiền cúng cho tư bản nữa, cứ ôm code về, thuê con máy chủ rẻ rẻ rồi tự host mà quậy.

Tuy nhiên, có bài học sương máu cho anh em làm app: Đừng bao giờ tin vào bảo mật bằng giọng nói nữa. Voice biometrics giờ là dĩ vãng rồi. Clone có 10s thì bảo mật bằng niềm tin.

Cho anh em nào muốn test nhân phẩm, team Fish Audio đang thả code giảm giá 50% PH-FishS2 trên trang của họ. Clone giọng sếp mà xin nghỉ phép thử xem sao (nếu toang thì C4F không chịu trách nhiệm nhé).


Nguồn hóng hớt: Product Hunt - Fish Audio S2

Bài viết liên quan

head, binary, coding, programming, program, technology, digital, brain, mind, computer, think, number, software, data, robot, robotics, black computer, black technology, black laptop, black brain, black thinking, black data, black digital, black robot, black mind, black code, black numbers, black coding, black software, black think, black programming, programming, brain, mind, software, robot, robot, robot, robot, robot, robotics, black technology, black brain
AI & AutomationCông nghệ

Pháp sư Trung Hoa thả xích Qwen3.6-35B-A3B: Đệ tử tự code, tự fix bug cho anh em

Lại thêm một con hàng AI coding 35 tỷ tham số từ Qwen, hứa hẹn khả năng 'Agentic' tự cày code làm giang cư mận Hacker News rần rần.

17 thg 44 phút đọc
Đọc tiếp →
audio, concert, mic, microphone, music, performance, show, sing, singer, singing, sound, stage, vocal, yellow, concert, mic, microphone, microphone, microphone, microphone, microphone, music, music, music, music, singer, singer, singing, singing, stage, stage, stage, stage
AI & AutomationCông nghệ

Google Gemini 3.1 Flash TTS: Đạo diễn giọng nói bằng chữ, ElevenLabs tới công chuyện?

Google vừa tung Gemini 3.1 Flash TTS với trò nhúng thẳng audio tags vào text. Có đủ tuổi đấm ElevenLabs hay chỉ là bánh vẽ? Cùng C4F mổ xẻ nhé anh em.

17 thg 43 phút đọc
Đọc tiếp →
bot, generator, cyborg, automation, scifi, stars, planets, space, ufo, robot, tech, alien, mechanical, machine, technology, android, science, nature, robotic, futuristic, galaxy, helper, matrix, sunrise, sunset, dawn
AI & AutomationCông nghệ

Qwen3.6-Plus Gáy Bẩn 'Real World Agents' Hay Lại Thêm Một Cú Lừa Từ Pháp Sư Trung Hoa?

Bóc phốt nhẹ con hàng Qwen3.6-Plus đang lọt top Hacker News với điểm số 455. 'Real world agents' thực chất là gì hay lại lùa gà anh em dev?

3 thg 43 phút đọc
Đọc tiếp →
ai generated, robot, microphone, future, science fiction, technology, robotics, music, studio, singing
AI & AutomationCông nghệ

Cekura: Khi AI Voice Lên Production Cãi Khách Như Chém Chả Và Giải Pháp Cứu Cánh

Anh em làm AI Agent hay gặp cảnh trên dev thì mượt, lên production bot lại cãi khách nhem nhẻm. Xem ngay cách Cekura 'khóa mõm' mấy con bot ngáo ngơ này.

24 thg 35 phút đọc
Đọc tiếp →
robot, ai, cyborg, automation, android, tech, technology, machine, future, artificial, bionic, digital, futuristic, human, intelligence, robotic, fantasy, robotics, matrix, matrix code, blue technology, blue fantasy, blue digital, blue robot, blue future, blue tech, blue human, blue code, blue coding, automation, tech, matrix, matrix, matrix, matrix, matrix
AI & AutomationCông nghệ

OpenCode được gần 900 điểm HN: AI Agent mã nguồn mở xuất chiến, dev sắp ra đê?

Một dự án AI coding agent mã nguồn mở mang tên OpenCode vừa giật gần 900 upvotes trên Hacker News. Cùng xem anh em dev phản ứng ra sao với con hàng này.

21 thg 33 phút đọc
Đọc tiếp →
vietnamese, spokesperson, portrait, model, fashion, woman, asian, female, interview, speech, politician, person, conference, politics, press, news, media, microphone, ai generated
Công nghệAI & Automation

xAI Thả Xích API Grok Text-to-Speech: Lại Thêm Một Cú Vả Vào Thị Trường Giọng Nói AI?

Grok Text-to-Speech API vừa chính thức lên sóng. Liệu con bài mới của nhà xAI có đủ trình làm anh em dev quay xe từ ElevenLabs hay OpenAI sang không?

18 thg 33 phút đọc
Đọc tiếp →