J Li

jiazhengli

https://jiazhengli.com/

AI & ML interests

None yet

Recent Activity

upvoted a paper 20 days ago

Two Heads Are Better Than One: Dual-Model Verbal Reflection at Inference-Time

updated a model 23 days ago

jiazhengli/Qwen2.5-7B-RoleMRC-sft

updated a model 23 days ago

jiazhengli/Qwen2.5-7B-RoleMRC-dpo

View all activity

Organizations

None yet

Collections 3

Papers 10

models 12

datasets 3

jiazhengli/AERA

Viewer • Updated Oct 14, 2024 • 17.4k • 117

jiazhengli/Synthetic_Rationale

Viewer • Updated Oct 14, 2024 • 32.9k • 84 • 1

jiazhengli/Rationale_MCTS

Viewer • Updated Oct 14, 2024 • 8.71k • 93 • 2

J Li

AI & ML interests

Recent Activity

Organizations

Collections 3

jiazhengli/Rationale_MCTS

jiazhengli/Synthetic_Rationale

jiazhengli/deberta-v3-large-Rationale-to-Score

jiazhengli/Meta-Llama-3-8B-QLoRA-Assessment-Rationale-sft

jiazhengli/Pythia-2.8B-HH-RLHF-Iterative-SamPO

jiazhengli/Pythia-2.8B-TLDR-Iterative-SamPO

Junrulu/Llama-3-8B-Instruct-Iterative-SamPO

Eliminating Biased Length Reliance of Direct Preference Optimization via Down-Sampled KL Divergence

Papers 10

models 12

jiazhengli/Qwen2.5-7B-RoleMRC-sft

jiazhengli/Qwen2.5-7B-RoleMRC-dpo

jiazhengli/Llama-3.1-8B-RoleMRC-sft

jiazhengli/Llama-3.1-8B-RoleMRC-dpo

jiazhengli/long-t5-tglobal-large-AERA

jiazhengli/Mixtral-8x7B-Instruct-v0.1-QLoRA-Assessment-Rationale-dpo

jiazhengli/Mixtral-8x7B-Instruct-v0.1-QLoRA-Assessment-Rationale-sft

jiazhengli/Meta-Llama-3-8B-QLoRA-Assessment-Rationale-sft

jiazhengli/Meta-Llama-3-8B-QLoRA-Assessment-Rationale-dpo

jiazhengli/deberta-v3-large-Rationale-to-Score

datasets 3

jiazhengli/AERA

jiazhengli/Synthetic_Rationale

jiazhengli/Rationale_MCTS

J Li

AI & ML interests

Recent Activity

Organizations

Collections 3

Papers 10

models 12 Sort: Recently updated

datasets 3 Sort: Recently updated

models 12

datasets 3