动态推理方法DOTS：优化智能助理交互体验与提升大模型推理能力-模具钢网

审阅者指出，本文提出了一种动态推理方法，该方法允许模型根据输入问题的特征来确定适当的原子作用，并进行全面的实验以证明所提出方法的有效性。

点方法的核心是动态搜索最佳推理路径。这种动态推理能力将在方案中显示出独特的优势，在这种情况下，对不同问题（例如使用智能助手的使用）的推理和灵活的响应非常灵活。用户可能会提出一些非常简单的问题，例如“今天的天气如何？”或非常专业的问题。点可以根据推理路径的动态调整来优化用户交互体验。

此外，DOTS方法可以被视为一种收集高质量培训数据的方法，也可以用于提高培训后未来大规模模型的推理能力。

这项研究始于Yue Murong在Wenlin Yao博士（目前是亚马逊高级应用科学家）的指导下在腾讯西雅图人工智能实验室实习生的。

大型模型的推理能力一直是学术界和行业中的热门话题，因此他们的最初目标是探索如何进一步增强这一关键能力。

最初，他们深入研究了主流当前方法，以提高大型模型的推理功能，包括及时的工程和指导调整。但是，在分析过程中，他们逐渐发现了现有方法的局限性：这些方法通常缺乏关键链接，即缺乏链接，该链接使大型模型可以在回答问题之前积极思考。

就像面对复杂的数学问题时一样，人们将积极评估他们是否需要使用计算工具；在玩24分游戏时，他们会有意识地测试他们提出的计划是否合理。但是现有的大型模型，尤其是开源模型，缺乏这种灵活的思维模型。

他们认识到这个问题的根本原因在于缺乏培训数据。传统培训数据通常只包含问题和答案，但是关于如何选择和使用推理措施的战略指导很少。例如，数学问题的培训数据只能显示理解问题的步骤。大型模型只知道正确的答案，但不会尝试各种推理行为，例如分解问题或验证结果是否有助于获取答案。

基于这种想法，他们在本文中构想了一种全新的方法：给定培训数据，让大型模型独立探索推理行动的各种可能组合，并从中学习最佳策略。当面对不同的问题时，大型模型通过尝试分解问题，使用代码和结果验证来解决问题。

根据他们的尝试结果，他们让大型模型学习如何预测最佳推理路径，从而优化自己的推理能力。

在研究期间，他们不断调整和改进方法。例如，如果最初的实验结果没有得到显着改善，他们会反思他们是否需要为大型模型提供更清晰的指导，例如，通过解释来帮助他们理解和学习推理行动。

经过多次改进，他们对多个数据集和多个设置进行了广泛的测试。实验表明，在每个数据集和不同条件下，大型的推理能力都得到了提高。实验的成功不仅验证了方法的有效性，而且更重要的是，它证明了大型模型的巨大潜力：他们可以训练他们，使他们能够仔细，独立地计划推论行动。

后来，他们希望训练更大的数据集，结合更多推理动作，并探索如何更好地利用搜索获得的结果。

目前，Yue Murong是美国乔治·梅森大学的博士生。他在姚Zyu教授的领导下学习。他的研究方向是设计高效，安全和经济的大型模型代理，以处理复杂的推理任务。

参考：

1。

操作/类型：他钦隆

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：http://mjgaz.cn/fenxiang/274289.html

动态推理方法DOTS：优化智能助理交互体验与提升大模型推理能力