8 118 155

Emanuele Vivoli

emanuelevivoli

https://emanuelevivoli.github.io

AI & ML interests

I work on Comics/Manga :)

Recent Activity

liked a model 4 days ago

HuggingFaceTB/SmolVLM2-2.2B-Instruct

liked a model 5 days ago

microsoft/Phi-4-multimodal-instruct

upvoted a paper 5 days ago

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

View all activity

Organizations

emanuelevivoli's activity

liked a model 4 days ago

HuggingFaceTB/SmolVLM2-2.2B-Instruct

Image-Text-to-Text • Updated 4 days ago • 429k • 106

liked a model 5 days ago

microsoft/Phi-4-multimodal-instruct

Automatic Speech Recognition • Updated 2 days ago • 231k • 1.04k

upvoted a paper 5 days ago

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

Paper • 2503.01743 • Published 6 days ago • 65

New activity in VLR-CVC/ComicsPAP 9 days ago

[bot] Conversion to Parquet

#1 opened 19 days ago by

parquet-converter

replied to maxiw's post 9 days ago

this is very interesting!

liked a model 9 days ago

allenai/olmOCR-7B-0225-preview

Image-Text-to-Text • Updated 13 days ago • 142k • 503

upvoted 2 papers 17 days ago

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 17 days ago • 128

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published 18 days ago • 157

liked a dataset 18 days ago

VLR-CVC/ComicsPAP

Viewer • Updated 5 days ago • 80.6k • 2.12k • 11

liked a Space 22 days ago

Grandma Secret Sauce

🍝

Fetch and display recipes from web URL

upvoted a paper 26 days ago

LM2: Large Memory Models

Paper • 2502.06049 • Published 28 days ago • 30

liked a model 30 days ago

laion/CLIP-ViT-H-14-laion2B-s32B-b79K

Zero-Shot Image Classification • Updated Jan 22 • 1.24M • 362

liked a model about 1 month ago

sentence-transformers/sentence-t5-base

liked a Space about 1 month ago

Kosmos 2.5

🌍

Extract text or generate Markdown from images

liked a model about 1 month ago

microsoft/kosmos-2.5

Text2Text Generation • Updated Aug 28, 2024 • 1.47k • 189

upvoted an article about 1 month ago

Article

Open-R1: a fully open reproduction of DeepSeek-R1

Jan 28

• 795

liked a model about 2 months ago

FoundationVision/Infinity

Updated 20 days ago • 143 • 28

upvoted 2 papers about 2 months ago

TokenVerse: Versatile Multi-concept Personalization in Token Modulation Space

Paper • 2501.12224 • Published Jan 21 • 46

MMVU: Measuring Expert-Level Multi-Discipline Video Understanding

Paper • 2501.12380 • Published Jan 21 • 83

liked a dataset about 2 months ago

tomg-group-umd/pixelprose

Viewer • Updated Jun 23, 2024 • 15.6M • 485 • 144