rl-llm-agent
/

Llama-3.2-3B-Instruct-online-dpo-alfworld-iter2

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-online-dpo-alfworld-iter2

Commit History

upload checkpoint

5b84a80
verified

sc2582 commited on 18 days ago

initial commit

713636f
verified

sc2582 commited on 18 days ago