Kai Zuberbühler's picture

586 314

Kai Zuberbühler

kaizuberbuehler

·

k-zubi

AI & ML interests

language models, agents, image generation, music generation

Recent Activity

upvoted a paper about 5 hours ago

Learning Getting-Up Policies for Real-World Humanoid Robots

updated a collection about 5 hours ago

Reasoning, Thinking, RL and Test-Time Scaling

updated a collection about 5 hours ago

View all activity

Organizations

None yet

kaizuberbuehler's activity

upvoted a paper about 5 hours ago

Learning Getting-Up Policies for Real-World Humanoid Robots

Paper • 2502.12152 • Published 20 days ago • 37

updated 2 collections about 5 hours ago

Reasoning, Thinking, RL and Test-Time Scaling

99 items • Updated about 5 hours ago • 4

LM Inference

47 items • Updated about 5 hours ago

upvoted a paper about 5 hours ago

Diverse Inference and Verification for Advanced Reasoning

Paper • 2502.09955 • Published 24 days ago • 17

liked a Space 7 days ago

Distill Any Depth

Generate depth maps from your images

updated a collection 13 days ago

Leaderboards

29 items • Updated 13 days ago • 2

upvoted an article 13 days ago

Article

Agent Leaderboard: Evaluating AI Agents in Multi-Domain Scenarios

By

and 1 other •

26 days ago

• 16

updated 3 collections 16 days ago

Benchmarks

80 items • Updated 16 days ago • 1

Vision Language Models

77 items • Updated 16 days ago • 5

Agents

94 items • Updated 16 days ago • 3

upvoted a paper 16 days ago

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

Paper • 2502.14282 • Published 18 days ago • 18

updated 2 collections 16 days ago

Code Generation

22 items • Updated 16 days ago

Reasoning, Thinking, RL and Test-Time Scaling

99 items • Updated about 5 hours ago • 4

upvoted a paper 16 days ago

S*: Test Time Scaling for Code Generation

Paper • 2502.14382 • Published 18 days ago • 59

updated 2 collections 16 days ago

Benchmarks

80 items • Updated 16 days ago • 1

Agents

94 items • Updated 16 days ago • 3

upvoted a paper 16 days ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 17 days ago • 177

updated a collection 16 days ago

Reasoning, Thinking, RL and Test-Time Scaling

99 items • Updated about 5 hours ago • 4

upvoted a paper 16 days ago

Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published 20 days ago • 28

updated a collection 16 days ago

Benchmarks

80 items • Updated 16 days ago • 1