AmberYifan
/

Qwen2.5-7B-sft-harmful-hhrlhf-gen-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-7B-sft-harmful-hhrlhf-gen-dpo

Commit History

Model save

70e58c1
verified

AmberYifan commited on 17 days ago

Training in progress, epoch 3, checkpoint

179e2d8
verified

AmberYifan commited on 17 days ago

Training in progress, epoch 3

f9f13c7
verified

AmberYifan commited on 17 days ago

Training in progress, epoch 2, checkpoint

945f555
verified

AmberYifan commited on 17 days ago

Training in progress, epoch 2

ca8568b
verified

AmberYifan commited on 17 days ago

Training in progress, epoch 1, checkpoint

c03df49
verified

AmberYifan commited on 17 days ago

Training in progress, epoch 1

c4262ef
verified

AmberYifan commited on 17 days ago

initial commit

db4d687
verified

AmberYifan commited on 17 days ago