游民星空 > 资讯中心 > 正文

微软推出“从错误中学习”模型训练法,号称可“模仿人类学习过程 改善AI推理能力”

2023-11-07 17:15:43 来源:互联网 作者:单梦蛙 编辑:单梦蛙 浏览:loading

11月7日消息,微软亚洲研究院联合北京大学、西安交通大学等高校,提出了一项名为“从错误中学习(Learning from Mistake,LeMA)”的AI训练方法,号称可以通过模仿人类学习知识的过程,来改进AI推理能力。

游民星空

当下 OpenAI GPT-4 和谷歌 aLM-2 等大语言模型在自然语言处理(NLP)任务,及思维链(chain-of-thought,CoT)推理的数学难题任务中都有不错的表现。

但例如 LLaMA-2 及 Baichuan-2 等开源大模型,在处理相关问题时则有待加强。为了提升开源这些大语言模型的思维链推理能力,研究团队提出了 LeMA 方法。这种方法主要是模仿人类的学习过程,通过“从错误中学习”,以改进模型的推理能力。

游民星空

研究人员的方法是使用一对包含“错误解答”与“修正后正确答案”的数据来微调相关模型。为取得相关数据,研究人员收集了 5 个不同大语言模型(包括 LLaMA 及 GPT 系列)的错误答案和推理过程,再以 GPT-4 作为“订正者”,提供修正后的正确答案。

目前研究人员已将 LeMA 的相关资料公开在GitHub上,感兴趣的小伙伴们可以点此跳转

人喜欢
游民星空APP
随时掌握游戏情报
code
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏
微软推出"从错误中学习"模型训练法:模仿人类学习过程https://imgs.gamersky.com/upimg/new_preview/2023/11/07/origin_b_202311071711324977.jpg