https://arxiv.org/abs/2304.03277
Instruction Tuning with GPT-4 (Baolin Peng, Chunyuan Li, Pengcheng He, Michel Galley, Jianfeng Gao)
아니 MSR에서 instruction dataset을 GPT-4로 생성해서 공개했네요. RLHF용 comparison data까지 만들었습니다. 물론 비상업적 용도로만 사용 가능하다는 라이센스를 명시하긴 했는데 그건 대체로 다 그렇긴 하죠. 어차피 다들 이런 거 할 거 알고 있으니까 그냥 우리가 만든거 써 라는 느낌인지...여하간 그렇습니다.
#instruct