4 6 25

Yi Jiang

JiangYi

https://enjoyyi.github.io/

iFighting

AI & ML interests

visual generation Large Language Models

Recent Activity

authored a paper 7 days ago

DanceTrack: Multi-Object Tracking in Uniform Appearance and Diverse Motion

authored a paper 7 days ago

OmniTokenizer: A Joint Image-Video Tokenizer for Visual Generation

authored a paper 7 days ago

Sparse R-CNN: End-to-End Object Detection with Learnable Proposals

View all activity

Organizations

JiangYi's activity

authored 10 papers 7 days ago

Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis

Paper • 2412.04431 • Published Dec 5, 2024 • 18

Liquid: Language Models are Scalable Multi-modal Generators

Paper • 2412.04332 • Published Dec 5, 2024 • 2

Goku: Flow Based Video Generative Foundation Models

Paper • 2502.04896 • Published about 1 month ago • 96

FlashVideo:Flowing Fidelity to Detail for Efficient High-Resolution Video Generation

Paper • 2502.05179 • Published about 1 month ago • 24

Language as Queries for Referring Video Object Segmentation

Paper • 2201.00487 • Published Jan 3, 2022

UniTok: A Unified Tokenizer for Visual Generation and Understanding

Paper • 2502.20321 • Published 10 days ago • 28

liked a model 8 days ago

Junfeng5/Liquid_V1_7B

Text-to-Image • Updated 9 days ago • 175 • 3

commented a paper 10 days ago

UniTok: A Unified Tokenizer for Visual Generation and Understanding

Paper • 2502.20321 • Published 10 days ago • 28 •

upvoted a paper 10 days ago

UniTok: A Unified Tokenizer for Visual Generation and Understanding

Paper • 2502.20321 • Published 10 days ago • 28

liked a model 10 days ago

FoundationVision/unitok_tokenizer

Feature Extraction • Updated 7 days ago • 38 • 6

liked a model 13 days ago

Wan-AI/Wan2.1-T2V-14B

Text-to-Video • Updated 12 days ago • 186k • • 956

liked a Space 14 days ago

Liquid demo

🔥

Liquid demo app

published a model 28 days ago

FoundationVision/FlashVideo

Text-to-Video • Updated 24 days ago • 13

published a dataset about 1 month ago

FoundationVision/goku_website

Viewer • Updated 28 days ago • 133 • 2.01k

liked a model about 1 month ago

FoundationVision/Infinity

Updated 20 days ago • 143 • 28

liked a dataset about 2 months ago

KwaiVGI/SynCamVideo-Dataset

Preview • Updated Dec 11, 2024 • 158 • 21