相关内容

相关内容

推理大模型有冗余问题？R-KV开源登场，显存大幅下降

推理大模型虽好，但一个简单的算数问题能推理整整三页，还都是重复的“废话”，找不到重点……一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法，出现了！R-

2025-06-17 95
相关内容

推箱子、俄罗斯方块成大模型benchmark，o3-pro表现惊人

推箱子、俄罗斯方块……这些人类的经典怀旧小游戏，也成大模型benchmark了。o3-pro刚刚也挑战了这两款游戏，而且表现还都不错，直接突破了benchmark上限。

2025-06-16 112
相关内容

R-KV开源登场！显存降90%、吞吐乘6.6，准确率达100%

10% KV无损数学推理！开源方法解决推理大模型「记忆过载」难题,推理,冗余,数学,大模型,开源方法,记忆过载,官方网页,token

2025-06-16 152
相关内容

阿里云上线Qwen3系列模型全家桶，Star数超16.9k火爆出圈

作者 | 柴旭晨编辑 | 张晓玲、周智宇行业翘首以盼的DeepSeek-R2没等到，阿里云却先一步丢出了核弹。4月29日凌晨，阿里云正式上线了Qwen3系列模型“全家桶”

2025-05-12 126
相关内容

2025年全球AI大模型发展路径差异化，国内外竞争激烈

腾讯科技特约作者｜晓静编辑｜萌萌 2025年，全球AI大模型的发展路径呈现出显著的差异化趋势。全球范围内

2025-05-12 138
相关内容

5月9日消息：阿里巴巴开源ZeroSearch大模型，无需搜索激励搜索能力

阿里开源ZeroSearch模型：可“自学”搜索能力，无需外部搜索引擎,谷歌,搜索引擎,知名企业,github,阿里巴巴集团,zerosearch

2025-05-10 134
相关内容

垂类模型企业转型面临哪些风险挑战？先做事前验尸剖析

《孙子兵法》有云：“上兵伐谋，其次伐交，其次伐兵，其下攻城。”此言意在阐明，制胜之道在于谋略，智者未战先谋败，方能立于不败之地。正如我在上篇文章《工业互联网+人工智能

2025-05-10 140
相关内容

大模型AI应用在消费级市场爆发，企业级市场更迅猛

明敏杰西卡发自凹非寺量子位 | 公众号 QbitAI 大模型AI应用在消费级市场的爆发，已引发各界广泛关注。

2025-05-08 103
相关内容

上海交通大学等团队推Video-XL-Pro，超Meta 7B模型刷新超长视频理解SOTA

目前，模型、代码、训练数据均已开源，以促进长视频理解社区的合作和发展。

2025-05-06 71
相关内容

密歇根州立大学张益萌：个性化多人图像生成的研究探索

本文第一作者为密歇根州立大学计算机系博士生张益萌，系 OPTML 实验室成员，指导老师为刘思佳助理教授。研究工作主要完成于张益萌在字节跳动的实习期间。

2025-05-05 75

联系我们

在线咨询：

微信号：13588888888

工作日：9:30-18:30，节假日休息