Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2502.15814

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 18 days ago • 66
Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published 20 days ago • 28
HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading

Paper • 2502.12574 • Published 20 days ago • 11
Large Language Diffusion Models

Paper • 2502.09992 • Published 24 days ago • 99

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 18 days ago • 66

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 18 days ago • 66

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 18 days ago • 66

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 18 days ago • 66

FM_Training_Infra

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 18 days ago • 66

All resources for SpeechLMs from "Slamming: Training a Speech Language Model on One GPU in a Day". We provide tokeniser, lm, and datasets

slprl/slam

Audio-to-Audio • Updated 12 days ago • 260 • 9
slprl/slam_scaled

Audio-to-Audio • Updated 12 days ago • 185 • 4
slprl/SpokenSwag

Viewer • Updated 13 days ago • 67.9k • 357 • 4
slprl/mhubert-base-25hz

Feature Extraction • Updated Jan 10 • 4.12k • 4

Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU

Paper • 2403.06504 • Published Mar 11, 2024 • 53
Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Paper • 2502.06703 • Published 27 days ago • 142
Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 18 days ago • 66

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published Dec 20, 2024 • 38
DeepSeek-V3 Technical Report

Paper • 2412.19437 • Published Dec 27, 2024 • 54
Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 18 days ago • 66

How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published Dec 19, 2024 • 51
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator

Paper • 2412.12094 • Published Dec 16, 2024 • 10
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

Paper • 2306.07691 • Published Jun 13, 2023 • 8
iSTFTNet: Fast and Lightweight Mel-Spectrogram Vocoder Incorporating Inverse Short-Time Fourier Transform

Paper • 2203.02395 • Published Mar 4, 2022

Previous
1
2
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs