Daniel van Strien's picture

Daniel van Strien PRO

davanstrien

·

https://danielvanstrien.xyz/

AI & ML interests

Machine Learning Librarian

Recent Activity

updated a dataset 21 minutes ago

davanstrien/pdf-oneliner-test

published a dataset 21 minutes ago

davanstrien/pdf-oneliner-test

upvoted a collection about 3 hours ago

View all activity

Organizations

Posts 50

Post

2820

📊 Introducing "Hugging Face Dataset Spotlight" 📊

I'm excited to share the first episode of our AI-generated podcast series focusing on nice datasets from the Hugging Face Hub!

This first episode explores mathematical reasoning datasets:

- SynthLabsAI/Big-Math-RL-Verified: Over 250,000 rigorously verified problems spanning multiple difficulty levels and mathematical domains
- open-r1/OpenR1-Math-220k: 220,000 math problems with multiple reasoning traces, verified for accuracy using Math Verify and Llama-3.3-70B models.
- facebook/natural_reasoning: 1.1 million general reasoning questions carefully deduplicated and decontaminated from existing benchmarks, showing superior scaling effects when training models like Llama3.1-8B-Instruct.

Plus a bonus segment on bespokelabs/bespoke-manim!

https://www.youtube.com/watch?v=-TgmRq45tW4

Articles 21

Article

303

Open-R1: Update #1

View all Articles

Collections 10

Papers 4

arxiv:2211.10086

arxiv:2211.05100

arxiv:2205.04738

arxiv:2204.05211

spaces 52

Temp Argilla

Progress Test

Display progress leaderboards and annotations

Running on CPU Upgrade

Huggingface Datasets Search V2

Display API documentation with Swagger UI

Smol Gradio Api

Generate concise summaries of Hugging Face card texts

Extractous

Extract text and metadata from documents

Running on Zero

ColPali fine-tuning Query Generator

Generate retrieval queries from document images

models 148

davanstrien/SmolLM2-135M-tldr-sft-2025-03-12_19-02

Text Generation • Updated 19 days ago • 163

davanstrien/SmolLM2-135M-tldr-sft-2025-03-12_19-02-Q8_0-GGUF

Updated 20 days ago • 108

davanstrien/SmolLM2-135M-tldr-sft-2025-03-12_18-10-Q8_0-GGUF

Updated 20 days ago • 21

davanstrien/SmolLM2-360M-tldr-sft-2025-03-12_17-46-Q8_0-GGUF

Updated 20 days ago • 29

davanstrien/SmolLM2-360M-tldr-sft-2025-03-12_17-46-Q4_K_M-GGUF

Updated 20 days ago • 24

davanstrien/SmolLM2-360M-tldr-sft-2025-03-12_17-18

Updated 20 days ago • 23

davanstrien/Smol-Hub-tldr

Text Generation • Updated 21 days ago • 189 • 9

davanstrien/fineweb-fra_latn-quality-transformer

Text Classification • Updated 22 days ago • 5

davanstrien/fineweb-swe_latn-quality-transformer

Text Classification • Updated 22 days ago • 7

davanstrien/Smol-Hub-tldr-Q8_0-GGUF

Updated Feb 14 • 4

datasets 328

davanstrien/pdf-oneliner-test

Updated 21 minutes ago

davanstrien/magpie-preference

Preview • Updated 2 days ago • 800 • 13

davanstrien/nob

Viewer • Updated 7 days ago • 1k • 23

davanstrien/grpo-rewards

Viewer • Updated 8 days ago • 176 • 34

davanstrien/models_with_metadata_and_summaries_vllm

Viewer • Updated 19 days ago • 21.3k • 50

davanstrien/models_with_metadata_and_summaries

Viewer • Updated 19 days ago • 2k • 110

davanstrien/parsed-model-cards

Viewer • Updated 21 days ago • 5k • 153 • 2

davanstrien/models_with_summaries_and_params

Viewer • Updated 27 days ago • 975 • 173 • 1

davanstrien/datasets_with_metadata_and_summaries

Viewer • Updated 29 days ago • 48.5k • 99

davanstrien/grpo-completions-new

Viewer • Updated 29 days ago • 896 • 499 • 1