Cornell-AGI (Cornell-AGI)

GitBag

updated a dataset 3 months ago

Cornell-AGI/amazon_movie_tv_item_mxbai

Viewer • Updated Dec 2, 2024 • 10.5k • 67

GitBag

updated a dataset 5 months ago

Cornell-AGI/amazon_movie_tv_llama_mxbai

Viewer • Updated Oct 23, 2024 • 17.1k • 104

GitBag

authored 3 papers 5 months ago

Reviewer2: Optimizing Review Generation Through Prompt Generation

Paper • 2402.10886 • Published Feb 16, 2024

REBEL: Reinforcement Learning via Regressing Relative Rewards

Paper • 2404.16767 • Published Apr 25, 2024 • 2

Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF

Paper • 2410.04612 • Published Oct 6, 2024

GitBag

updated 2 datasets 5 months ago

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_2

Viewer • Updated Oct 8, 2024 • 116k • 106 • 1

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

Viewer • Updated Oct 8, 2024 • 64.6k • 128 • 2

GitBag

updated 2 models 5 months ago

Cornell-AGI/REFUEL-Llama-3-Armo-iter_2

Updated Oct 8, 2024 • 12

Cornell-AGI/REFUEL-Llama-3-Armo-iter_1

Updated Oct 8, 2024 • 11

GitBag

updated 2 datasets 5 months ago

Cornell-AGI/REFUEL-UltraInteract-setting-two

Viewer • Updated Oct 5, 2024 • 106k • 140 • 1

Cornell-AGI/REFUEL-hh-setting-two

Viewer • Updated Oct 5, 2024 • 165k • 123

GitBag

updated 3 datasets 6 months ago

GitBag

updated 6 models 6 months ago

Cornell-AGI/REBEL-Llama-3-Armo-iter_3

Updated Sep 2, 2024 • 11 • 2

Cornell-AGI/REBEL-Llama-3-Armo-iter_2

Updated Sep 2, 2024 • 12 • 1

Cornell-AGI/REBEL-Llama-3-Armo-iter_1

Updated Sep 2, 2024 • 10 • 1

Cornell-AGI/REBEL-Llama-3-epoch_2

Text Generation • Updated Sep 1, 2024 • 34 • 3

Cornell-AGI/REBEL-Llama-3

Text Generation • Updated Sep 1, 2024 • 44 • 1

Cornell-AGI/REBEL-OpenChat-3.5

Text Generation • Updated Sep 1, 2024 • 25 • 1

Cornell-AGI

AI & ML interests

Cornell-AGI's activity

Cornell-AGI/amazon_movie_tv_item_mxbai

Cornell-AGI/amazon_movie_tv_llama_mxbai

Reviewer2: Optimizing Review Generation Through Prompt Generation

REBEL: Reinforcement Learning via Regressing Relative Rewards

Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

Cornell-AGI/REFUEL-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Llama-3-Armo-iter_1

Cornell-AGI/REFUEL-UltraInteract-setting-two

Cornell-AGI/REFUEL-hh-setting-two

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_1

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_3

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_2

Cornell-AGI/REBEL-Llama-3-Armo-iter_3

Cornell-AGI/REBEL-Llama-3-Armo-iter_2

Cornell-AGI/REBEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-epoch_2

Cornell-AGI/REBEL-Llama-3

Cornell-AGI/REBEL-OpenChat-3.5

AI & ML interests

Team members 1

Cornell-AGI's activity