相关内容
-
推理大模型有冗余问题?R-KV开源登场,显存大幅下降
推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点……一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法,出现了!R-
-
推箱子、俄罗斯方块成大模型benchmark,o3-pro表现惊人
推箱子、俄罗斯方块……这些人类的经典怀旧小游戏,也成大模型benchmark了。o3-pro刚刚也挑战了这两款游戏,而且表现还都不错,直接突破了benchmark上限。
-
R-KV开源登场!显存降90%、吞吐乘6.6,准确率达100%
10% KV无损数学推理!开源方法解决推理大模型「记忆过载」难题,推理,冗余,数学,大模型,开源方法,记忆过载,官方网页,token
-
阿里云上线Qwen3系列模型全家桶,Star数超16.9k火爆出圈
作者 | 柴旭晨编辑 | 张晓玲、周智宇行业翘首以盼的DeepSeek-R2没等到,阿里云却先一步丢出了核弹。4月29日凌晨,阿里云正式上线了Qwen3系列模型“全家桶”
-
2025年全球AI大模型发展路径差异化,国内外竞争激烈
腾讯科技特约作者|晓静 编辑|萌萌 2025年,全球AI大模型的发展路径呈现出显著的差异化趋势。 全球范围内
-
5月9日消息:阿里巴巴开源ZeroSearch大模型,无需搜索激励搜索能力
阿里开源ZeroSearch模型:可“自学”搜索能力,无需外部搜索引擎,谷歌,搜索引擎,知名企业,github,阿里巴巴集团,zerosearch
-
垂类模型企业转型面临哪些风险挑战?先做事前验尸剖析
《孙子兵法》有云:“上兵伐谋,其次伐交,其次伐兵,其下攻城。”此言意在阐明,制胜之道在于谋略,智者未战先谋败,方能立于不败之地。正如我在上篇文章《工业互联网+人工智能
-
大模型AI应用在消费级市场爆发,企业级市场更迅猛
明敏 杰西卡 发自 凹非寺 量子位 | 公众号 QbitAI 大模型AI应用在消费级市场的爆发,已引发各界广泛关注。
-
上海交通大学等团队推Video-XL-Pro,超Meta 7B模型刷新超长视频理解SOTA
目前,模型、代码、训练数据均已开源,以促进长视频理解社区的合作和发展。
-
密歇根州立大学张益萌:个性化多人图像生成的研究探索
本文第一作者为密歇根州立大学计算机系博士生张益萌,系 OPTML 实验室成员,指导老师为刘思佳助理教授。研究工作主要完成于张益萌在字节跳动的实习期间。