zhuqihao's picture

18 7

zhuqihao

zqh11

·

AI & ML interests

None yet

Recent Activity

authored a paper about 2 months ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

liked a model about 2 months ago

deepseek-ai/DeepSeek-R1-Zero

authored a paper 7 months ago

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search

View all activity

Organizations

Papers 7

arxiv:2501.12948

arxiv:2408.08152

arxiv:2406.11931

arxiv:2405.14333

models

None public yet

datasets

None public yet