https://arxiv.org/abs/2307.04657

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset (Jiaming Ji, Mickel Liu, Juntao Dai, Xuehai Pan, Chi Zhang, Ce Bian, Chi Zhang, Ruiyang Sun, Yizhou Wang, Yaodong Yang)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

230710 BeaverTails.md

230710 BeaverTails.md

Files

230710 BeaverTails.md

Latest commit

History

230710 BeaverTails.md

File metadata and controls