相关内容
-
推理大模型有冗余问题?R-KV开源登场,显存大幅下降
推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点……一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法,出现了!R-
-
推箱子、俄罗斯方块成大模型benchmark,o3-pro表现惊人
推箱子、俄罗斯方块……这些人类的经典怀旧小游戏,也成大模型benchmark了。o3-pro刚刚也挑战了这两款游戏,而且表现还都不错,直接突破了benchmark上限。
-
R-KV开源登场!显存降90%、吞吐乘6.6,准确率达100%
10% KV无损数学推理!开源方法解决推理大模型「记忆过载」难题,推理,冗余,数学,大模型,开源方法,记忆过载,官方网页,token
-
阿里云上线Qwen3系列模型全家桶,Star数超16.9k火爆出圈
作者 | 柴旭晨编辑 | 张晓玲、周智宇行业翘首以盼的DeepSeek-R2没等到,阿里云却先一步丢出了核弹。4月29日凌晨,阿里云正式上线了Qwen3系列模型“全家桶”
-
2025年全球AI大模型发展路径差异化,国内外竞争激烈
腾讯科技特约作者|晓静 编辑|萌萌 2025年,全球AI大模型的发展路径呈现出显著的差异化趋势。 全球范围内
-
5月9日消息:阿里巴巴开源ZeroSearch大模型,无需搜索激励搜索能力
阿里开源ZeroSearch模型:可“自学”搜索能力,无需外部搜索引擎,谷歌,搜索引擎,知名企业,github,阿里巴巴集团,zerosearch
-
大模型AI应用在消费级市场爆发,企业级市场更迅猛
明敏 杰西卡 发自 凹非寺 量子位 | 公众号 QbitAI 大模型AI应用在消费级市场的爆发,已引发各界广泛关注。
-
大模型元年热门的提示词工程师,如今为何沦为企业不愿扩增岗位?
这个曾年薪百万的AI岗位过气了
-
百模大战激战正酣,2023 年成立的中国 AI 初创企业欲革新 Transformer 架构
在“百模大战”打得不可开交的时候,一家成立于2023年6月的中国AI初创企业试图掀翻2017年谷歌提出的Transformer架构,深入更底层做创新。
-
第二届数字政府40人论坛聚焦智能数据标注产业发展趋势
中新网北京5月1日电(记者 张尼)“传统人力密集型标注模式正加速转型为智能驱动型、平台化的新业态。”日前在北京发布的一份报告对智能数据标注产业发展趋势作出判断。 近日