Fish Audio S2 Pro

LIVE

Text-to-Speech Studio · Model: S2 Pro · GPU: RTX 5880 Ada

🎨 Job Templates · 1-click apply (voice + settings + filename)
🎙 Chọn Giọng Nói Giọng mặc định
Giọng mặc định của S2 Pro — model tự động nhận diện ngôn ngữ và phát âm.
Để có giọng tự nhiên, hấp dẫn hơn, dùng tab Voice Cloning để upload/thu âm giọng mẫu, hoặc chọn từ Voice Library đã lưu.
🎤
Kéo thả hoặc click để chọn file âm thanh mẫu
WAV · MP3 · FLAC · M4A · Nên 5–30 giây · Tối đa 10 MB
Chưa nhập transcript
⚠️ Quan trọng: Fish S2 Pro cần cả audio + transcript khớp 100% để clone giọng. Nếu bạn không nhập transcript, model chỉ học được pitch/timbre cơ bản → giọng output không giống bạn. Dùng nút Auto-transcribe (chỉ Chrome/Edge, hỗ trợ tiếng Việt) hoặc gõ tay từng chữ. Audio mẫu phải là 1 người nói duy nhất, không nhạc nền, không echo, mono 16kHz+.
Chưa có voice nào. Hãy upload hoặc thu âm ở tab Voice Cloning rồi bấm Lưu vào Library.
📝 Văn Bản
0 ký tự · 0 từ · ~0 chunk · ⏱ 0s Ctrl + Enter để tạo
⏱ Nhịp: [pause] [short pause] [long pause] … dừng — em dash , pause ngắn ⏎ xuống dòng ⏎⏎ đoạn mới
😂 Phản ứng: [laugh] [chuckle] [giggle] [sigh] [gasp] [inhale] [exhale] [clears throat] [cry]
😊 Cảm xúc: [happy] vui [sad] buồn [excited] hào hứng [calm] bình thản [warm] ấm áp [sarcastic] mỉa mai [curious] tò mò [hesitant] ngập ngừng [serious] nghiêm túc
🔊 Âm lượng & nhấn: [whisper] thì thầm [quietly] nói nhỏ [shouting] nói to [soft tone] nhẹ [emphasis] nhấn ↕ Bọc selection A↑ CAPS selection 🎭 Xem tất cả tags →
🎭 Audio Tags — Điều khiển giọng điệu
Fish Audio S2 Pro chính thức hỗ trợ [bracket] syntax với mô tả tự nhiên (English works best). Model học implicit mapping từ training data → bạn có thể dùng tự do mọi mô tả như [whispers sweetly], [laughing nervously], không bị giới hạn list cố định. Cue có thể đặt ở bất kỳ vị trí nào: "I can't believe it [gasp] you actually did it [laugh]". Combine pause-marker (... ) và CHỮ HOA để có hiệu ứng chắc chắn nhất.
😊 Basic Emotions (24 — official S1/S2 list)
[happy] vui [sad] buồn [angry] tức giận [excited] hào hứng [calm] bình thản [nervous] lo lắng [confident] tự tin [surprised] ngạc nhiên [satisfied] [delighted] [scared] sợ [worried] [upset] [frustrated] [depressed] [empathetic] [embarrassed] [disgusted] [moved] [proud] [relaxed] [grateful] biết ơn [curious] tò mò [sarcastic] mỉa mai
🎭 Advanced Emotions (25 — official)
[disdainful] [unhappy] [anxious] [hysterical] [indifferent] thờ ơ [uncertain] [doubtful] nghi ngờ [confused] bối rối [disappointed] [regretful] [guilty] [ashamed] [hopeful] [optimistic] [pessimistic] [nostalgic] [lonely] [bored] chán [contemptuous] [sympathetic] thương cảm [compassionate] [determined] quyết tâm [resigned] cam chịu [envious] [jealous]
😂 Audio Effects (10 — official paralinguistic)
[laughing] cười [laugh] cười (ngắn) [chuckling] cười khẽ [sobbing] khóc nức nở [crying loudly] [cry] [sighing] thở dài [sigh] [groaning] rên [panting] hổn hển [gasping] hít sâu [gasp] [yawning] ngáp [snoring] ngáy [inhale] [exhale] [clears throat]
🔊 Tone Markers (5 — official volume/pacing)
[whispering] thì thầm [whisper] [soft tone] nhẹ [quietly] nói nhỏ [shouting] hét [screaming] gào [in a hurry tone] vội [emphasis] nhấn
⏱ Pause / Nhịp (combine với dấu câu cho hiệu quả tốt nhất)
[pause] [short pause] [long pause] [break] (S1 official) [long-break] (S1) … dừng dài — em dash , pause ngắn
💡 Pause chắc chắn nhất: dùng ... hoặc xuống đoạn (⏎⏎). Tag [pause] là natural-language hint cho S2.
🎬 Free-form Style (S2 đặc biệt — natural language tự do)
[whispers sweetly] [laughing nervously] [speaking softly] [said with a smile] [in a dramatic voice] [matter-of-fact tone] [childlike] trẻ con [elderly tone] [narrator] [mysterious] [friendly] [professional] [apologetic] [encouraging] [playful] tinh nghịch [stuttering] lắp bắp [speaking slowly] [speaking quickly]
💡 S2 Pro hiểu được bất kỳ mô tả nào trong [brackets]. Cứ tự sáng tạo: [in a sleepy voice], [crying while talking]...
💥 Special Effects (official S2 — đám đông/môi trường)
[audience laughing] [crowd laughing] [background laughter] [applause] vỗ tay
⚠ Các SFX khác (gunshot, explosion...) không trong official list — có thể bị đọc literal. Hậu kỳ trong DAW/video editor sẽ an toàn hơn.
🌍 Accent (S2 free-form — đáng tin nhất khi reference voice match)
[American accent] [British accent] [Australian accent] [Indian accent] [Northern VN] giọng Bắc [Southern VN] giọng Nam [Central VN] giọng Trung
💡 Accent chỉ đáng tin khi dùng reference voice cloning của accent tương ứng. Chỉ dùng tag không thường yếu.
🎬 Multi-voice dialogue (cần switch voice trong Library)
<VOICE_A> </VOICE_A> <VOICE_B> </VOICE_B>
💡 Fish Audio chưa auto-switch giọng — bạn cần tách đoạn, generate từng giọng riêng rồi ghép (dùng feature concat sẵn có).
⚙️ Cài Đặt
💪 Robust — ổn định, ít biến đổi 🎯 Natural — khuyến nghị (mặc định) 🎨 Creative — biểu cảm, đa dạng
💡 Natural phù hợp 90% use-case. Creative tốt cho kịch/kể chuyện có cảm xúc. Robust cho quảng cáo/giáo dục cần đọc đều.
Ổn địnhSáng tạo
Tập trungĐa dạng
0.5x2x
⚙️ Advanced Sampling (Fish S2 Pro native params)
Giữ seed giống → generate ra audio giống
Lặp nhiềuTránh lặp
~4 tokens = 1s audio
Server-side chunking
Generate nhiều phiên bản, chọn best
Generate song song để so sánh
📖 Từ điển Phát âm · Fix đọc sai tên riêng, thuật ngữ EN
Fish Audio hay đọc sai các từ tiếng Anh trong câu tiếng Việt (vd: AI đọc thành "ai" thay vì "ây ai"). Khai báo thay thế ở đây — sẽ áp dụng trước khi gửi API (không đổi text gốc trong ô).
🎭 Multi-voice Dialogue · Mỗi nhân vật giọng riêng
Viết kịch bản hội thoại theo cú pháp [Tên] đầu mỗi câu. Mỗi nhân vật được map sang 1 voice trong Library. Audio sẽ được render tuần tự (giọng A → silence → giọng B...) và ghép thành 1 file.
Ví dụ:
[Alice] Chào Bob, dạo này thế nào?
[Bob] Cảm ơn Alice, vẫn ổn. Còn cậu?
[Alice] Mình cũng tốt. Tối nay đi cà phê nhé?
🗂 Batch Mode · Generate nhiều file cùng lúc
Paste script nhiều dòng — mỗi dòng là một file audio riêng. Phù hợp để làm voice-over cho video nhiều đoạn, dubbing hội thoại, tạo audio lesson. Sẽ dùng voice + settings hiện tại (cloning / library / mặc định).
💡 Ví dụ: text = Xin chào {{name}}, hôm nay là {{day}}! + var name=An,Bình,Cường + day=Thứ Hai,Thứ Ba,Thứ Tư → 3 files cá nhân hoá. Bỏ trống để tắt.
💡 POST JSON: {prefix, total, success, failed, elapsed_sec, items:[{idx,filename,size,text,error?}]}. Để trống = tắt.
{prefix} {seq} {seq2} (zero-pad) {date} 2026-04-21 {datetime} {voice} {lang} {slug} (đầu dòng) {ext}
→ voice_01.mp3
🎛 Nâng Cao · Background music, Webhook
🎵
Click để chọn nhạc nền (MP3/WAV)
🪄 Voice Enhance · Preprocess reference audio để clone chính xác hơn
Xử lý file mẫu trước khi clone: trim silence, chuẩn hóa volume, cắt ngắn về 15-25s (sweet spot). Audio input dùng ở Clone tab hoặc Library voice đang chọn.
🎬 Script Studio · Multi-scene video script (intro → body → outro)
Chia script thành nhiều scene, mỗi scene có voice/tone/pause riêng. Xuất ra 1 file audio liền mạch + SRT subtitles.
🎧 Audio Mix Studio · Trộn voice + BGM với ducking
Upload nhạc nền, tự động ducking (giảm BGM khi có voice), fade-in/out, export master.
🕐 Lịch Sử Xóa lịch sử

Chưa có lịch sử.