12 479 45

Vlad Bogolin

vladbogo

https://vladbogo.com

AI & ML interests

LLMs, Computer Vision

Recent Activity

updated a collection 1 day ago

AI Paper of the Day

upvoted a paper 1 day ago

Unified Reward Model for Multimodal Understanding and Generation

updated a collection 3 days ago

AI Paper of the Day

View all activity

Organizations

vladbogo's activity

upvoted a paper 1 day ago

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published 6 days ago • 102

upvoted a paper 3 days ago

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published 6 days ago • 83

upvoted a paper 5 days ago

Token-Efficient Long Video Understanding for Multimodal LLMs

Paper • 2503.04130 • Published 7 days ago • 76

upvoted a paper 6 days ago

Predictive Data Selection: The Data That Predicts Is the Data That Teaches

Paper • 2503.00808 • Published 11 days ago • 53

upvoted a paper 7 days ago

MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents

Paper • 2503.01935 • Published 10 days ago • 23

upvoted a paper 8 days ago

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

Paper • 2503.01743 • Published 9 days ago • 72

upvoted a paper 9 days ago

How far can we go with ImageNet for Text-to-Image generation?

Paper • 2502.21318 • Published 12 days ago • 25

upvoted a paper 10 days ago

Language Models' Factuality Depends on the Language of Inquiry

Paper • 2502.17955 • Published 16 days ago • 30

upvoted a paper 11 days ago

Can Language Models Falsify? Evaluating Algorithmic Reasoning with Counterexample Creation

Paper • 2502.19414 • Published 14 days ago • 18

upvoted a paper 14 days ago

VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing

Paper • 2502.17258 • Published 17 days ago • 73

upvoted 2 papers 18 days ago

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published 21 days ago • 160

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 21 days ago • 178

upvoted a paper 22 days ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published 25 days ago • 142

upvoted 2 papers 24 days ago

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Paper • 2502.09696 • Published 27 days ago • 39

WorldGUI: Dynamic Testing for Comprehensive Desktop GUI Automation

Paper • 2502.08047 • Published 29 days ago • 26

upvoted a paper 25 days ago

SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models

Paper • 2502.09604 • Published 27 days ago • 32

upvoted a paper 26 days ago

TextAtlas5M: A Large-scale Dataset for Dense Text Image Generation

Paper • 2502.07870 • Published 29 days ago • 43

upvoted a paper 27 days ago

Competitive Programming with Large Reasoning Models

Paper • 2502.06807 • Published Feb 3 • 67

upvoted a paper 28 days ago

Goku: Flow Based Video Generative Foundation Models

Paper • 2502.04896 • Published Feb 7 • 96

upvoted a paper about 1 month ago

DynVFX: Augmenting Real Videos with Dynamic Content

Paper • 2502.03621 • Published Feb 5 • 29