19 27 57

Li Dong

unilm

AI & ML interests

Language Model Pre-Training

Recent Activity

liked a dataset 2 days ago

HuggingFaceTB/finemath

liked a model 7 days ago

microsoft/VidTok

liked a dataset 7 days ago

TIGER-Lab/OmniEdit-Filtered-1.2M

View all activity

Organizations

unilm's activity

liked a dataset 2 days ago

HuggingFaceTB/finemath

Viewer • Updated 2 days ago • 48.3M • 9.76k • 160

liked a model 7 days ago

microsoft/VidTok

Updated about 13 hours ago • 13

liked a dataset 7 days ago

TIGER-Lab/OmniEdit-Filtered-1.2M

Viewer • Updated 20 days ago • 1.2M • 18.3k • 39

liked 3 datasets 9 days ago

upvoted a paper 9 days ago

Apollo: An Exploration of Video Understanding in Large Multimodal Models

Paper • 2412.10360 • Published 12 days ago • 131

liked 3 datasets 10 days ago

JourneyDB/JourneyDB

Updated Aug 10, 2023 • 2.98k • 66

mlfoundations/datacomp_1b

Viewer • Updated Aug 21, 2023 • 1.39B • 2.43k • 30

Koala-36M/Koala-36M-v1

Viewer • Updated Oct 12 • 36M • 527 • 22

authored 4 papers 12 days ago

Language Models as Inductive Reasoners

Paper • 2212.10923 • Published Dec 21, 2022 • 2

Image as a Foreign Language: BEiT Pretraining for All Vision and Vision-Language Tasks

Paper • 2208.10442 • Published Aug 22, 2022

RedStone: Curating General, Code, Math, and QA Data for Large Language Models

Paper • 2412.03398 • Published 21 days ago • 1

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published 14 days ago • 41

upvoted a paper 13 days ago

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published 14 days ago • 41

commented a paper 13 days ago

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published 14 days ago • 41 •

liked a dataset 29 days ago

Zyphra/Zyda-2

Viewer • Updated 14 days ago • 1.62B • 199k • 65

liked a dataset 30 days ago

espnet/yodas

Updated Jun 10 • 37.1k • 107

upvoted a paper about 1 month ago

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published Nov 7 • 111

authored a paper 2 months ago

You Only Cache Once: Decoder-Decoder Architectures for Language Models

Paper • 2405.05254 • Published May 8 • 10