李飞飞团队50美元训练模型类似尖端模型，基座为通义千问-模具钢网

主题：科学与技术晨报

NINA Technology News，2月6日晚上新闻，今天，Li Feifei和来自斯坦福大学和华盛顿大学的其他研究人员培训了一种名为S1的人工智能推论模型，价格低于50美元。该模型在数学和编码功能中进行了测试。本文的性能类似于尖端推断模型，例如OpenAl的O1和Depsek的R1，它引起了广泛关注。

但是，很快，S1模型被称为“未从头开始训练”，其基本模型是“ Ali Tongyi Qianwen模型”。作为回应，西娜技术要求阿里巴巴云进行确认，并确认了新闻并回答：“他们使用阿里巴巴·汤蒂·Qianwen Qwen2.5-32b-Instruct-instruct开源模型作为基础，在16 h100 gpus。有监督的微调26分钟，新的S1-32B进行了培训，与诸如OpenAI的O1和DeepSeek的R1等尖端推理模型的数学和编码功能相当。 “

阿里巴巴云说，DeepSeek早些时候正式透露，它将为社区开源的六种型号的DeepSeek-R1推理能力蒸馏，其中4个来自QWEN：基于QWEN-32B蒸馏的模型，以多种功能实现。它基准了Openai O1-Mini的效果。一段时间以来，在开源社区中受到极大追捧的Tongyi Qianwen Qwen由于这种新的推理模型技术而浮出水面：QWEN模型具有强大的性能，多样化的开源规模，并且拥有世界上最大的衍生品模型组。它已取代了Llama作为开源社区最重要的基准基本模型。

据了解，从2023年8月开始，阿里巴巴云汤蒂·Qianwen（Alibaba Cloud tongyi Qianwen 。它一直在表演中带领世界，并多次赢得了“全球开源冠军”。

目前，国内外开源社区中的QWEN衍生模型数量已超过90,000，超过了Llama系列衍生品模型。 Tongyi Qianwen Qwen已成长为世界上最大的生成语言模型组。全球AI模型开发人员使用QWEN，可以更好地比较差异化的技术，进一步促进Qwen的知名度，并使Qwen成为开源社区最重要的基准模型。（温门）

阿里李飞飞是哪里人_阿里李飞飞p几_

Sina Finance应用程序可用大量信息和准确的解释

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：http://mjgaz.cn/fenxiang/273941.html

李飞飞团队50美元训练模型类似尖端模型，基座为通义千问

相关推荐

联系我们