Art Atk

ArtAtk

AI & ML interests

Multimodal Models

Recent Activity

upvoted a paper about 23 hours ago

WORLDMEM: Long-term Consistent World Simulation with Memory

upvoted a paper 5 days ago

GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation

upvoted a paper 5 days ago

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

View all activity

Organizations

None yet

ArtAtk's activity

upvoted a paper about 23 hours ago

WORLDMEM: Long-term Consistent World Simulation with Memory

Paper • 2504.12369 • Published 2 days ago • 23

upvoted 2 papers 5 days ago

GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation

Paper • 2504.08736 • Published 7 days ago • 44

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

Paper • 2504.08685 • Published 8 days ago • 117

upvoted a paper 8 days ago

VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Paper • 2504.07960 • Published 8 days ago • 40

liked a model 15 days ago

Skywork/SkyReels-A2

Updated 11 days ago • 630 • 112

upvoted 2 papers 15 days ago

Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation

Paper • 2504.02542 • Published 16 days ago • 41

Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

Paper • 2503.24379 • Published 18 days ago • 74

upvoted a paper 21 days ago

Synthetic Video Enhances Physical Fidelity in Video Synthesis

Paper • 2503.20822 • Published 24 days ago • 16

upvoted 2 papers 24 days ago

Latent Space Super-Resolution for Higher-Resolution Image Generation with Diffusion Models

Paper • 2503.18446 • Published 26 days ago • 9

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published 26 days ago • 116

upvoted a paper 25 days ago

FFN Fusion: Rethinking Sequential Computation in Large Language Models

Paper • 2503.18908 • Published 25 days ago • 17

upvoted a paper 28 days ago

One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation

Paper • 2503.13358 • Published Mar 17 • 95

liked a Space 29 days ago

Hunyuan3D 2mini Turbo

🔥

Fast Images-to-3D Generation within 1 Second

upvoted 6 papers about 1 month ago

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published Mar 14 • 134

DiT-Air: Revisiting the Efficiency of Diffusion Model Architecture Design in Text to Image Generation

Paper • 2503.10618 • Published Mar 13 • 17

4D LangSplat: 4D Language Gaussian Splatting via Multimodal Large Language Models

Paper • 2503.10437 • Published Mar 13 • 31

upvoted a paper about 2 months ago

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

Paper • 2502.18137 • Published Feb 25 • 55