Audio Spaces

hysts 's Collections

Diffusion model Spaces

LLM Spaces

Audio Spaces

updated 7 days ago

Upvote

Runtime error

70

70

Whisper vs Distil-Whisper

📈
Runtime error

951

951

Seamless M4T

📞
Running on A10G

4.73k

4.73k

MusicGen

🎵

Generate music from text and melody descriptions
Runtime error

798

798

Audioldm Text To Audio Generation

🔊

Generate audio from text
Running on A10G

299

299

AudioLDM2 Text2Audio Text2Music Generation

🔊

Generate a video waveform from text-based audio descriptions
Runtime error

221

221

AudioSep

🐠
Running

157

157

Lp Music Caps

🎵

Create music captions from audio files
Running on T4

265

265

Tortoise Tts

🐢

ExpressivText-to-Speech
Running on T4

16

16

All In One

📊
Running on T4

2.31k

2.31k

XTTS

🐸
Paused

190

190

Coqui Bark Voice Cloning

🐸
Running on L4

355

355

VALL E X

🎙

Generate audio from text with a custom voice
Sleeping

192

192

WavJourney

🔥
Paused

265

265

Music To Image

🎶
Running on L4

279

279

MMS

🌍

Transform and identify speech with MMS
Running

556

556

ElevenLabs TTS

🗣

Generate realistic voices from text
Build error

288

288

AudioGPT

🚀
Running on T4

2.14k

2.14k

Bark

🐶

Generate realistic audio from text
Runtime error

36

36

SpeechT5 Speech Recognition Demo

👩
Runtime error

172

172

CoquiTTS (Official)

🐸
Running on L4

1.98k

1.98k

Whisper

📉

Transcribe or translate audio from files, microphone, or YouTube
Running on CPU Upgrade

615

615

Moe TTS

😊

Generate and convert speech using text and audio inputs
Build error

17

17

YourTTS

🔥
Running

543

543

Talking Face Generation with Multilingual TTS

👄

Generate a talking face video from text
Runtime error

563

563

OpenAI TTS New

📊
Sleeping

168

168

Mustango

🐢
Sleeping

55

55

OWSM Demo

🔊
Running on L4

614

614

StyleTTS 2

🗣

Efficient, fast, and natural text to speech with StyleTTS 2!
Running on T4

372

372

HierSpeech++ (Zero-shot TTS)

⚡

Generate high-quality speech from text using a prompt audio
Sleeping

20

20

Video2music

📚
Runtime error

187

187

Whisper Large V2

🤫
Running on T4

59

59

Musicgen Prompt Upsampling

🌖

Generate music from text prompts 🎶
Sleeping

62

62

Qwen-Audio

🎤

Interact with a chatbot using text and audio
Runtime error

517

517

Seamless M4T v2

📞
Running on T4

259

259

Seamless Streaming

📞

Translate text into different languages
Sleeping

48

48

Matcha TTS

🍵

Generate speech from text input
Running on Zero

252

252

MusicGen Streaming

🔥

Generate music from text prompts
Running on T4

311

311

Resemble Enhance

🚀

Enhance and clean audio files
Running on A10G

242

242

Singing Voice Conversion

🎼

Transform your voice into a singer's
Sleeping

50

50

NaturalSpeech2

🎧
Paused

21

21

Create Your Own TTS Dataset

🔥
Sleeping

Podcast Transcription

🐢
Running

1.02k

1.02k

OpenVoice

🤗
Runtime error

95

95

M2UGen Demo

💻
Runtime error

70

70

Pheme

📊
Sleeping

5

5

ESPnet2 TTS

📈

Generate speech from text in multiple languages
Running

16

16

Whisper-WebUI

🚀

Generate subtitles and translate them
Paused

171

171

Image2SFX Comparison

👂

Generates audio environment from an image
Runtime error

382

382

WhisperSpeech

🌬
Build error

146

146

MetaVoice 1B

🗣

A demo of MetaVoice 1B, a new TTS model by MetaVoice.
Running on CPU Upgrade

620

620

TTS Arena

🏆

Vote on the latest TTS models!
Running

171

171

Whisper Speech X DreamTalk

😽

Combine voice cloning and portrait lipsync animation
Running on T4

190

190

Canary 1b

🐤

Transcribe and translate audio into text
Paused

75

75

SALMONN Audio Questioning

⚡

Deeply interrogate audio file content
Running on T4

420

420

MeloTTS

🗣

Fast, efficient, & multilingual text-to-speech
Running on Zero

275

275

Audio Editing

🎧

Edit audios with text prompts
Runtime error

18

18

ChatMusician

💻
Running on CPU Upgrade

68

68

xVASynth TTS

🧝

CPU powered, low RTF, emotional, multilingual TTS
Running on Zero

174

174

NaturalSpeech3 FACodec

🏃

Convert and reconstruct speech files
Sleeping

24

24

Hey Gemma

☎
Configuration error

69

69

Ratchet + Whisper

🗣
Paused

3

3

AutoSubs

📜

Automatically add on-screen subs to your videos
Build error

162

162

VoiceCraft

📈
Running on Zero

276

276

TangoFlux

🚀

Text to Audio (Sound SFX) Generator
Running on Zero

790

790

Parler-TTS

🥖

High-fidelity Text-To-Speech
Running on A10G

182

182

Sing an idea ➡️ Music

🔥

Bring song ideas to life
Running on Zero

65

65

Musicgen Songstarter Demo

👁

Generate music using descriptions and optional melody audio
Running on TPU v5e

97

97

Whisper JAX

👀

Transcribe or translate audio from microphone, file, or YouTube
Running on Zero

20

20

AudioLCM

🏢

Generate audio from text
Running on Zero

159

159

Stable Audio Live Multiplayer

💻

Generate audio from text prompts
Running on Zero

394

394

Stable Audio Open Zero

🔥

Generate audio from text prompts
Sleeping

13

13

Make An Audio 3

🐠

Generate audio from text
Runtime error

60

60

Mars5 Space

📉
Runtime error

5

5

Tango Music AF

🎵

Text to Music Generator
Running

96

96

BigVGAN

🔊

Generate high-fidelity audio from input audio waveforms
Running on Zero

80

80

SenseVoice

🐠

Transcribe audio with emotions and events
Runtime error

58

58

CosyVoice 300M

📉
Running on Zero

24

24

PicoAudio

📈

Generate audio from text descriptions
Build error

6

6

Audio Flamingo Demo

📚
Sleeping

29

29

MusiConGen

🪩
Running

15

15

Mms Zeroshot

🌍

Generate transcript from audio input
Running

151

151

Qwen2 Audio Instruct Demo

🌍

Chat with a bot using text and audio
Running on Zero

115

115

GPT SoVITS V2

🤗

Generate speech from text with reference audio
Running on Zero

260

260

EzAudio

🟣

Generate and edit audio from text prompts
Running on Zero

216

216

OpenMusic

🎶

Generate high-quality music from text descriptions
Running on Zero

478

478

Midi Music Generator

🎼

Generate MIDI music from prompts
Running on Zero

758

758

Whisper Turbo

🤯

Transcribe or translate audio and YouTube videos
Running on Zero

285

285

Realtime Whisper Turbo

🤯

Realtime implementation of Whisper large turbo
Running

143

143

Whisper Large V3 Turbo WebGPU

🚀

ML-powered speech recognition directly in your browser
Running on L4

433

433

Fish Speech 1

🏆
Running on Zero

282

282

TTS Spaces Arena

🤗

Blind vote on HF TTS models!
Running on Zero

16

16

Diva Realtime Chat

🗣

Convert spoken words to text and voice assistant responses
Running on Zero

1.79k

1.79k

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running on Zero

249

249

MaskGCT TTS Demo

😻

MaskGCT TTS Demo
Running on Zero

70

70

MelodyFlow

🎵

Generate music from text and melody
Running on L40S

135

135

Fish Agent

💬

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

56

56

Nexa Omni Demo

🎧

Generate text from audio input
Running on L4

148

148

CosyVoice2-0.5B

🥳

Generate realistic voice audio from text and audio prompts
Running on Zero

1.87k

1.87k

Kokoro TTS

❤

Upgraded to v1.0!
Running on T4

83

83

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Running on Zero

248

248

Llasa 3b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)

Upvote

Collection guide
Browse collections

Whisper vs Distil-Whisper

Seamless M4T

MusicGen

Audioldm Text To Audio Generation

AudioLDM2 Text2Audio Text2Music Generation

AudioSep

Lp Music Caps

Tortoise Tts

All In One

XTTS

Coqui Bark Voice Cloning

VALL E X

WavJourney

Music To Image

MMS

ElevenLabs TTS

AudioGPT

Bark

SpeechT5 Speech Recognition Demo

CoquiTTS (Official)

Whisper

Moe TTS

YourTTS

Talking Face Generation with Multilingual TTS

OpenAI TTS New

Mustango

OWSM Demo

StyleTTS 2

HierSpeech++ (Zero-shot TTS)

Video2music

Whisper Large V2

Musicgen Prompt Upsampling

Qwen-Audio

Seamless M4T v2

Seamless Streaming

Matcha TTS

MusicGen Streaming

Resemble Enhance

Singing Voice Conversion

NaturalSpeech2

Create Your Own TTS Dataset

Podcast Transcription

OpenVoice

M2UGen Demo

Pheme

ESPnet2 TTS

Whisper-WebUI

Image2SFX Comparison

WhisperSpeech

MetaVoice 1B

TTS Arena

Whisper Speech X DreamTalk

Canary 1b

SALMONN Audio Questioning

MeloTTS

Audio Editing

ChatMusician

xVASynth TTS

NaturalSpeech3 FACodec

Hey Gemma

Ratchet + Whisper

AutoSubs

VoiceCraft

TangoFlux

Parler-TTS

Sing an idea ➡️ Music

Musicgen Songstarter Demo

Whisper JAX

AudioLCM

Stable Audio Live Multiplayer

Stable Audio Open Zero

Make An Audio 3

Mars5 Space

Tango Music AF

BigVGAN

SenseVoice

CosyVoice 300M

PicoAudio

Audio Flamingo Demo