相关内容

相关内容

5月9日消息：阿里巴巴开源ZeroSearch大模型，无需搜索激励搜索能力

阿里开源ZeroSearch模型：可“自学”搜索能力，无需外部搜索引擎,谷歌,搜索引擎,知名企业,github,阿里巴巴集团,zerosearch

2025-05-10 134
相关内容

近些年大型语言模型能力提升但仍存问题，推理概念引争论

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述,算法,推理,显式,深度思考模型

2025-05-03 142
相关内容

2017年Transformer论文成AI革命标志，2015年相关论文要素被掩盖？

机器之心报道编辑：张倩这篇论文包含了当前 LLM 的许多要素，十年后的今天或许仍值得一读。

2025-05-02 144
相关内容

推理成语言模型下一个主要前沿领域：强化学习对蒸馏模型的有效验证及新发现

强化学习的改进只是「噪音」？最新预警：冷静看待推理模型进展,推理,数学,算法,强化学习

2025-04-13 70
相关内容

阿里云AI势能大会：1年成绩、未来规划及AI趋势新见解

阿里云全面拥抱MCP协议！大模型API调用量年涨近100倍

2025-04-10 78
相关内容

Figure：成立三年估值400亿美元成全球最火人形机器人公司

泡沫之外。

2025-04-07 107
相关内容

阿里云开源通义千问QwQ-32B推理模型，性能超越DeepSeek R1和OpenAI-o1-mini

3月6日凌晨，阿里云发布并开源全新的推理模型通义千问QwQ-32B。官方称，这个新模型仅仅拥有320亿参数，但在性能上比肩6710亿参数的满血版DeepSeek R1。目前

2025-03-24 154
相关内容

AIxiv专栏促进学术交流，最新研究揭示强化学习数据影响力大于数量

大模型强化学习新发现：删减84%数据反提升效果,样本,实验,有效性,强化学习

2025-02-21 136
相关内容

OpenAI论文揭示：强化学习如何助力o3模型在2024 IOI和CodeForces上取得金牌水平

OpenAI:强化学习提高LLM性能,DeepSeek R1、Kimi k1.5发现o1秘密,编程,聚类,kimi,强化学习,openai,deepseek

2025-02-20 118
相关内容

探索形式化推理新纪元：普林斯顿大学开源哥德尔证明器Goedel-Prover

哥德尔-Prover超过DeepSeek-Prover，陈丹琦团队造出最强推理模型,推理,数学,定理,哥德尔,陈丹琦

2025-02-14 137

联系我们

在线咨询：

微信号：13588888888

工作日：9:30-18:30，节假日休息