1. 首页>>分享

动态推理方法DOTS:优化智能助理交互体验与提升大模型推理能力

审阅者指出,本文提出了一种动态推理方法,该方法允许模型根据输入问题的特征来确定适当的原子作用,并进行全面的实验以证明所提出方法的有效性。

点方法的核心是动态搜索最佳推理路径。这种动态推理能力将在方案中显示出独特的优势,在这种情况下,对不同问题(例如使用智能助手的使用)的推理和灵活的响应非常灵活。用户可能会提出一些非常简单的问题,例如“今天的天气如何?”或非常专业的问题。点可以根据推理路径的动态调整来优化用户交互体验。

此外,DOTS方法可以被视为一种收集高质量培训数据的方法,也可以用于提高培训后未来大规模模型的推理能力。

这项研究始于Yue Murong在Wenlin Yao博士(目前是亚马逊高级应用科学家)的指导下在腾讯西雅图人工智能实验室实习生的。

大型模型的推理能力一直是学术界和行业中的热门话题,因此他们的最初目标是探索如何进一步增强这一关键能力。

最初,他们深入研究了主流当前方法,以提高大型模型的推理功能,包括及时的工程和指导调整。但是,在分析过程中,他们逐渐发现了现有方法的局限性:这些方法通常缺乏关键链接,即缺乏链接,该链接使大型模型可以在回答问题之前积极思考。

就像面对复杂的数学问题时一样,人们将积极评估他们是否需要使用计算工具;在玩24分游戏时,他们会有意识地测试他们提出的计划是否合理。但是现有的大型模型,尤其是开源模型,缺乏这种灵活的思维模型。

他们认识到这个问题的根本原因在于缺乏培训数据。传统培训数据通常只包含问题和答案,但是关于如何选择和使用推理措施的战略指导很少。例如,数学问题的培训数据只能显示理解问题的步骤。大型模型只知道正确的答案,但不会尝试各种推理行为,例如分解问题或验证结果是否有助于获取答案。

基于这种想法,他们在本文中构想了一种全新的方法:给定培训数据,让大型模型独立探索推理行动的各种可能组合,并从中学习最佳策略。当面对不同的问题时,大型模型通过尝试分解问题,使用代码和结果验证来解决问题。

根据他们的尝试结果,他们让大型模型学习如何预测最佳推理路径,从而优化自己的推理能力。

在研究期间,他们不断调整和改进方法。例如,如果最初的实验结果没有得到显着改善,他们会反思他们是否需要为大型模型提供更清晰的指导,例如,通过解释来帮助他们理解和学习推理行动。

经过多次改进,他们对多个数据集和多个设置进行了广泛的测试。实验表明,在每个数据集和不同条件下,大型的推理能力都得到了提高。实验的成功不仅验证了方法的有效性,而且更重要的是,它证明了大型模型的巨大潜力:他们可以训练他们,使他们能够仔细,独立地计划推论行动。

后来,他们希望训练更大的数据集,结合更多推理动作,并探索如何更好地利用搜索获得的结果。

目前,Yue Murong是美国乔治·梅森大学的博士生。他在姚Zyu教授的领导下学习。他的研究方向是设计高效,安全和经济的大型模型代理,以处理复杂的推理任务。

参考:

1。

操作/类型:他钦隆

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274289.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息