OmniSafeAI

university

https://github.com/PKU-Alignment

Activity Feed Request to join this org

AI & ML interests

None defined yet.

OmniSafeAI's activity

jijiaming

authored a paper 7 months ago

ProgressGym: Alignment with a Millennium of Moral Progress

Paper • 2406.20087 • Published Jun 28, 2024 • 3

XuehaiPan

authored a paper over 1 year ago

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset

Paper • 2307.04657 • Published Jul 10, 2023 • 6

calico-1226

authored a paper over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

jijiaming

authored a paper over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

RuiyangSun

authored a paper over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

XuehaiPan

authored 2 papers over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

Baichuan 2: Open Large-scale Language Models

Paper • 2309.10305 • Published Sep 19, 2023 • 19

RuiyangSun

authored a paper over 1 year ago

Baichuan 2: Open Large-scale Language Models

Paper • 2309.10305 • Published Sep 19, 2023 • 19

calico-1226

authored a paper over 1 year ago

Baichuan 2: Open Large-scale Language Models

Paper • 2309.10305 • Published Sep 19, 2023 • 19

jijiaming

authored a paper over 1 year ago

Baichuan 2: Open Large-scale Language Models

Paper • 2309.10305 • Published Sep 19, 2023 • 19

RuiyangSun

authored a paper over 1 year ago

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset

Paper • 2307.04657 • Published Jul 10, 2023 • 6

RuiyangSun

updated a dataset almost 2 years ago

OmniSafeAI/hh-prompts

Viewer • Updated Apr 22, 2023 • 169k • 18 • 1