Barret李靖:OpenAI联合创始人、研究科学家John…

2023-12-10

OpenAI 联合创始人、研究科学家 John Schulman 认为,RLHF 才是 ChatGPT 的秘密武器(secret sauce)。训练数据的体量固然重要,但是让 ChatGPT 更容易推断出用户的意图,产生质变的根本原因是已在 InstructGPT(ChatGPT 前身)使用的 “人类反馈的强化学G(RLHF)” 技术。
Google…
--来自:Barret李靖
cccdv.com
原文链接

最新回复(0)