13 74 1312

Zhipeng Yang

svjack

https://github.com/svjack

svjack

AI & ML interests

Video, Stable Diffusion,CV ,NLP,Search Engine ,Dialogue System,Question Answer System, Knowledge Base

Recent Activity

updated a dataset about 7 hours ago

svjack/Genshin_Impact_5_Nations_Scene_Videos_SP_Sumeru_Reconstructed_Captioned

published a dataset about 7 hours ago

svjack/Genshin_Impact_5_Nations_Scene_Videos_SP_Sumeru_Reconstructed_Captioned

updated a dataset about 8 hours ago

svjack/Garden_Of_Words_Videos_Captioned

View all activity

Organizations

svjack's activity

upvoted 3 papers 3 days ago

CrowdSelect: Synthetic Instruction Data Selection with Multi-LLM Wisdom

Paper • 2503.01836 • Published 6 days ago • 10

GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control

Paper • 2503.03751 • Published 4 days ago • 18

Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers

Paper • 2503.00865 • Published 7 days ago • 55

upvoted a paper 5 days ago

Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation

Paper • 2503.01370 • Published 6 days ago • 8

upvoted 2 papers 6 days ago

Towards an AI co-scientist

Paper • 2502.18864 • Published 11 days ago • 41

CODESYNC: Synchronizing Large Language Models with Dynamic Code Evolution at Scale

Paper • 2502.16645 • Published 14 days ago • 21

upvoted a paper 9 days ago

Rank1: Test-Time Compute for Reranking in Information Retrieval

Paper • 2502.18418 • Published 12 days ago • 25

upvoted 2 articles 10 days ago

Article

Fine-tune Deepseek-R1 with a Synthetic Reasoning Dataset

•

27 days ago

• 46

Article

Wanx AI ：AlibabaCloud Best Video Generation Model

•

13 days ago

• 6

upvoted a paper 10 days ago

GHOST 2.0: generative high-fidelity one shot transfer of heads

Paper • 2502.18417 • Published 12 days ago • 62

upvoted 3 papers 11 days ago

upvoted 2 papers 12 days ago

SurveyX: Academic Survey Automation via Large Language Models

Paper • 2502.14776 • Published 17 days ago • 91

X-Dancer: Expressive Music to Human Dance Video Generation

Paper • 2502.17414 • Published 13 days ago • 11

upvoted 4 papers 13 days ago

YOLOv12: Attention-Centric Real-Time Object Detectors

Paper • 2502.12524 • Published 19 days ago • 10

MMTEB: Massive Multilingual Text Embedding Benchmark

Paper • 2502.13595 • Published 18 days ago • 31

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 17 days ago • 128

PhotoDoodle: Learning Artistic Image Editing from Few-Shot Pairwise Data

Paper • 2502.14397 • Published 17 days ago • 38

upvoted a paper 16 days ago

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

Paper • 2502.14846 • Published 17 days ago • 13