Shuo Hu

hoooos50

AI & ML interests

None yet

Recent Activity

upvoted a paper 7 days ago

Qwen2.5-Omni Technical Report

upvoted a paper 7 days ago

Survey on Evaluation of LLM-based Agents

upvoted a paper 7 days ago

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

View all activity

Organizations

None yet

hoooos50's activity

upvoted 5 papers 7 days ago

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 9 days ago • 113

Survey on Evaluation of LLM-based Agents

Paper • 2503.16416 • Published 14 days ago • 81

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published 22 days ago • 67

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published 28 days ago • 103

DropletVideo: A Dataset and Approach to Explore Integral Spatio-Temporal Consistent Video Generation

Paper • 2503.06053 • Published 27 days ago • 136

upvoted 15 papers 11 days ago

Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20, 2024 • 44

Multimodal Autoregressive Pre-training of Large Vision Encoders

Paper • 2411.14402 • Published Nov 21, 2024 • 46

DimensionX: Create Any 3D and 4D Scenes from a Single Image with Controllable Video Diffusion

Paper • 2411.04928 • Published Nov 7, 2024 • 57

TransPixar: Advancing Text-to-Video Generation with Transparency

Paper • 2501.03006 • Published Jan 6 • 26

RealCritic: Towards Effectiveness-Driven Evaluation of Language Model Critiques

Paper • 2501.14492 • Published Jan 24 • 33

Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models

Paper • 2501.01423 • Published Jan 2 • 40

Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation

Paper • 2501.12202 • Published Jan 21 • 42

InternLM-XComposer2.5-Reward: A Simple Yet Effective Multi-Modal Reward Model

Paper • 2501.12368 • Published Jan 21 • 45

Enhancing Human-Like Responses in Large Language Models

Paper • 2501.05032 • Published Jan 9 • 54

BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature

Paper • 2501.07171 • Published Jan 13 • 55

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published Jan 17 • 113

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published Jan 28 • 118