LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
7.09k
•
87
Viewer
•
Updated
•
164
•
99.4k
•
284
Viewer
•
Updated
•
541
•
13.5k
•
59
Viewer
•
Updated
•
7.79k
•
358k
•
173
Updated
•
301k
•
61
Viewer
•
Updated
•
12.1k
•
43.1k
•
327
Viewer
•
Updated
•
231k
•
164k
•
408
Viewer
•
Updated
•
1.63k
•
32.2k
•
226
Viewer
•
Updated
•
17.6k
•
361k
•
625
Viewer
•
Updated
•
60k
•
353k
•
110
Updated
•
18.3k
•
54
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
297
•
17
Viewer
•
Updated
•
34.6k
•
2.56k
•
108
Viewer
•
Updated
•
95.4k
•
4.87k
•
38