奖励模型

AI

ChatGPT数据训练过程：从海量文本到智能对话

去年有个做AI创业的朋友问我一个问题：“我们团队花了三个月时间，把市面上能找到的几十万篇中文文章喂给一个开源的Transformer模型，为什么它生成的内容还是像在背课本，完全没有ChatGPT那种‘懂得举一反三’的感觉？” 我让他把整个训练链路复述一遍之后，发现了一个特别典型的问题，他们以为自己在复现ChatGPT的训练过程，但实际上只完成了整个流程里最不重要的那30%。大部分人聊ChatGPT…

程, 沐沐
1小时前
1000

站长微信

站长微信

返回顶部