1 18 2

Donghao Zhou

donghao-zhou

https://correr-zhou.github.io

Correr-Zhou

AI & ML interests

Generative AI

Recent Activity

upvoted a paper about 9 hours ago

EgoLife: Towards Egocentric Life Assistant

upvoted a paper 11 days ago

LDGen: Enhancing Text-to-Image Synthesis via Large Language Model-Driven Language Representation

upvoted a paper 12 days ago

DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks

View all activity

Organizations

None yet

donghao-zhou's activity

upvoted a paper about 9 hours ago

EgoLife: Towards Egocentric Life Assistant

Paper • 2503.03803 • Published 4 days ago • 31

upvoted a paper 11 days ago

LDGen: Enhancing Text-to-Image Synthesis via Large Language Model-Driven Language Representation

Paper • 2502.18302 • Published 12 days ago • 4

upvoted a paper 12 days ago

DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks

Paper • 2502.17157 • Published 14 days ago • 51

liked a Space 13 days ago

1.05k

Wan2.1

💻

Wan: Open and Advanced Large-Scale Video Generative Models

upvoted a paper 13 days ago

VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing

Paper • 2502.17258 • Published 13 days ago • 72

upvoted 2 papers 16 days ago

Dynamic Concepts Personalization from Single Videos

Paper • 2502.14844 • Published 17 days ago • 16

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 17 days ago • 128

upvoted a paper 21 days ago

MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency

Paper • 2502.09621 • Published 24 days ago • 27

upvoted a paper 26 days ago

Magic 1-For-1: Generating One Minute Video Clips within One Minute

Paper • 2502.07701 • Published 26 days ago • 34

upvoted a paper 29 days ago

ConceptAttention: Diffusion Transformers Learn Highly Interpretable Features

Paper • 2502.04320 • Published Feb 6 • 35

upvoted 2 papers about 1 month ago

Generating Multi-Image Synthetic Data for Text-to-Image Customization

Paper • 2502.01720 • Published Feb 3 • 8

VideoJAM: Joint Appearance-Motion Representations for Enhanced Motion Generation in Video Models

Paper • 2502.02492 • Published Feb 4 • 61

upvoted an article about 1 month ago

Article

Open-source DeepResearch – Freeing our search agents

Feb 4

• 1.14k

upvoted 2 papers about 1 month ago

PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding

Paper • 2501.16411 • Published Jan 27 • 18

Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step

Paper • 2501.13926 • Published Jan 23 • 37

upvoted a paper about 2 months ago

ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning

Paper • 2501.04698 • Published Jan 8 • 14

upvoted a paper 3 months ago

HumanEdit: A High-Quality Human-Rewarded Dataset for Instruction-based Image Editing

Paper • 2412.04280 • Published Dec 5, 2024 • 14

liked a model 5 months ago

Owen777/LongPrompt-LLamaGen

Text-to-Image • Updated Oct 21, 2024 • 3

authored 2 papers 5 months ago

MagicTailor: Component-Controllable Personalization in Text-to-Image Diffusion Models

Paper • 2410.13370 • Published Oct 17, 2024 • 37

RepMode: Learning to Re-parameterize Diverse Experts for Subcellular Structure Prediction

Paper • 2212.10066 • Published Dec 20, 2022