LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
5.09k
•
82
Viewer
•
Updated
•
164
•
59.2k
•
257
Viewer
•
Updated
•
541
•
6.02k
•
45
Viewer
•
Updated
•
7.79k
•
105k
•
164
Updated
•
77.1k
•
58
Viewer
•
Updated
•
12.1k
•
30k
•
308
Viewer
•
Updated
•
231k
•
87.8k
•
355
Viewer
•
Updated
•
1.63k
•
22.9k
•
214
Viewer
•
Updated
•
17.6k
•
160k
•
483
Viewer
•
Updated
•
60k
•
98.9k
•
101
Updated
•
29.6k
•
51
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
170
•
16
Viewer
•
Updated
•
34.6k
•
905
•
106
Viewer
•
Updated
•
95.4k
•
2.33k
•
36