Deping Zhang

Deping

AI & ML interests

Deep Reinforcement Learning, Computer Vision, Large Language Models ( especially their "emergence" capabilities), Theoretical Condensed Matter Physics ( superconductivity, ferromagnetism)

Recent Activity

updated a collection 7 days ago

LLM_VLM_R1

updated a collection 7 days ago

LLM_VLM_R1

updated a collection 7 days ago

LLM_VLM_R1

View all activity

Organizations

None yet

Collections 10

models

None public yet

datasets

None public yet

Deping Zhang

AI & ML interests

Recent Activity

Organizations

Collections 10

Med-RLVR: Emerging Medical Reasoning from a 3B base model via reinforcement Learning

MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement Learning

R1-T1: Fully Incentivizing Translation Capability in LLMs via Reasoning Learning

AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO

The Ultra-Scale Playbook

models

datasets