1. 首页>>分享

生成式 AI 的驱动力,就在这块「至尊」芯片上?

生成式AI的驱动力就在于这颗“至尊”芯片?

我们已经到了2024年底,我们已经可以感觉到大模型就在我们身边。

在新一代旗舰手机上,动态壁纸、AI绘图、语音通话摘要等功能一字排开,常用功能也通过新技术得到增强。

高通芯片制程发展_高通芯片的架构_

智能手机现在获得了与现实世界互动的能力。你可以拍张照片,直接问手机“你看到了什么?”它不仅可以向您介绍它,还可以增强画面的形象。

_高通芯片的架构_高通芯片制程发展

AI领域最前沿的智能也被塞进了手机里。它可以像人类一样点击屏幕来操作不同的应用程序。你可以拿起手机,用自然语言发出指令:“点三杯瑞幸美式咖啡,一大杯。”过一会儿,AI会自动选择外卖店、产品和口味,就等你付款了。

高通芯片的架构_高通芯片制程发展_

在新一代大机型和芯片的加持下,很多AI手机的体验得到了质的升级。新推出的能力包括但不限于端端AI代理、多模态大模型应用、视频AI消除、超级AI助手等。 ETC。

值得注意的是,这些生成式AI的背后是高通的“骁龙8至尊版”。作为业界最新的旗舰SoC,其在某些性能方面不负众望,实现了对同行的“降维”。不仅有颠覆性的性能提升,还有跨代的体验升级。

骁龙8至尊版:桌面级性能、移动能效

今年的骁龙到底做了什么,引发了端端AI的质变?

说起“骁龙8至尊版”,还得从今年如火如荼的AI PC领域说起。

今年6月,微软发布了专为AI设计的“Windows 11+PC”。它是有史以来最快、最智能的 Windows PC。搭配骁龙X系列PC平台,可实现超过45 TOPS(每秒万亿次运算)的AI算力,同时电池续航时间长达一整天。

高通芯片的架构__高通芯片制程发展

这款新型PC将先进的端侧大模型技术与一系列独特的AI能力相结合。它不仅能够感知和理解世界的多模态信息,还能自然地与人交流并执行复杂的任务。

微软官方表示:长期以来,这是一项“独家”能力。 Windows 11中的一些生成式AI只能在配备Oryon CPU的Snapdragon芯片上正常运行。

几个月之内,这种级别的功能就出现在手机上。在上个月的骁龙峰会上,高通正式推出了骁龙8 Elite移动平台,这是目前全球最快的移动系统级芯片。

_高通芯片制程发展_高通芯片的架构

与上一代骁龙8 Gen3相比,骁龙8至尊版直接提升CPU单核和多核性能45%,GPU性能提升40%,NPU输出速度达到每秒70+Tokens。同时,SoC整体功耗也降低了40%。

性能提升的背后,骁龙8至尊版由内而外发生了翻天覆地的变化:

首先是CPU,成功将高通自研架构的桌面级能力带到了手机上。它采用第二代定制的高通Oryon CPU,由两个主频为4.32GHz的“超级核心”和六个主频为3.53GHz的核心组成。它由性能核心组成,取消了之前的能效核心,不仅提供了更好的性能,还提高了功耗效率。

GPU方面,高通重新设计了Adreno GPU架构,并为每个片分配了专用内存。性能提升了40%,功耗降低了40%,光线追踪性能也提升了35%。

AI能力方面,在骁龙8至尊版上,得益于所有加速器核心吞吐量的提升,新架构Hexagon NPU性能提升45%,能效提升45%。此外,结合全面改进的CPU和GPU,该芯片可以动态管理所有核心的AI负载。与上一代相比,基础大语言模型token生成率提升了100%。

在这些新技术的加持下,搭载骁龙新平台的智能手机不仅可以全帧运行3A游戏大作,还可以运行一系列终端侧多模态生成式AI应用,带来改变人们使用习惯的体验,包括强大的AI影像功能、新一代游戏AI、超级智能助手等。

重构的不仅仅是硬件:大模型优化“呼朋唤友”

除了芯片本身之外,高通正在做的另一件事就是软硬件的整合。骁龙8至尊版的发布几乎被视为生成式AI技术的演示会。

这款移动芯片的发布得到了各家科技公司老总的祝福。发布时,OpenAI CEO Sam Altman、微软 CEO Satya Nadella、Meta CEO Mark Zuckerberg 等人均在网上为其背书。

_高通芯片制程发展_高通芯片的架构

这三人分别阐述了生成式AI在PC、增强现实设备、大模型应用等领域的愿景,目前他们都将目光聚焦在端侧AI。

正如Altman所说,云端和设备上的生成​​式AI形式是互惠互利的:服务器擅长训练大型模型,而在设备上利用设备的计算能力可以保护个人隐私并提高服务可靠性。

由于大型语言模型会消耗相当大的计算能力,因此之前的生成式人工智能技术大多是在云端实现的。在客户端部署更多的能力是未来的必然趋势。除了微软、Meta等硅谷巨头之外,不少国内厂商也与高通在新一代硬件上进行了合作。

致力于对标OpenAI的智普联合高通宣布,围绕骁龙8至尊版对最新一代端侧视觉大模型GLM-4V进行深度适配和推理优化。部署在设备侧后,手机等设备现在可以支持丰富的多模态交互方式,让人们获得更加场景化、个性化的终端侧智能体验。

国内主要厂商腾讯的混元模式也在高通的帮助下完成了终端侧部署。在骁龙8至尊版移动平台上,混源型号7B和3B版本都展现出了优化的运行性能。

结合高通完整的AI软件栈,包括高通人工智能模型增强工具包(AIMET),骁龙8至尊版可以为大型语言模型提供从底层硬件到框架的全面优化。 Snapdragon通过采用基于硬件的INT4量化技术,大幅提升了混元大模型在终端侧的运行效率。终端侧推理可实现首次令牌生成延迟仅为150ms,解码速率超过30令牌/秒。

此前,腾讯混元大模型已为大量腾讯自有应用提供底层支持,包括微信输入法、腾讯手机管家、QQ、腾讯视频、QQ浏览器、企业微信、腾讯会议等,覆盖700多个业务场景。

经过高通技术栈的深度优化,很多急需落地的大型模型已经达到了设备端可用性的水平。

例如,腾讯手机管家的短信智能识别功能现已基于混元端侧模型全面上线。具有更强的语义理解能力,能够更准确地理解短信的意图。短信召回率提升近200%,识别准确。率提高了20%。由于短信往往涉及用户的个人信息,端端AI在保证优异性能的同时,也能有效保护用户个人信息的隐私和安全。

通过高通与合作伙伴的整合,打通了终端侧大模型从芯片到应用的优化路径。也许未来的某一天,你会发现你每天使用的App在某次更新后增加了生成式AI功能。

端侧AI堆栈,纵横融合

推出Extreme Edition芯片的高通希望将业务扩展到PC和移动终端之外。

高通首席执行官安蒙在骁龙峰会上表示:“高通一直是一家推动无线通信行业发展的公司,也是最专注于无线技术的公司。但我们也积极欢迎变化。高通不仅仅是一家公司专注于无线连接。”

上个月与骁龙8至尊版一起发布的芯片包括Snapdragon Cockpit Elite和Snapdragon Ride Elite平台,专门为汽车定制,分别针对智能座舱和自动驾驶。

高通芯片的架构__高通芯片制程发展

其中,骁龙座舱至尊版所采用的Oryon CPU围绕汽车平台进行了多方面的改进。其CPU算力较上一代提升3倍,AI性能也突飞猛进,达到上一代的12倍。此外,还通过软件虚拟化、多操作系统等机制支持车机任务灵活集中处理,满足汽车安全标准。

现在,汽车制造商可以在同一个SoC上无缝运行数字座舱和智能驾驶等功能,真正实现了他们近年来一直追求的硬件架构的统一。

Snapdragon Cockpit Extreme Edition平台和Snapdragon Ride Extreme Edition平台将于2025年出样。理想汽车已正式宣布将率先使用高通最新的Snapdragon Extreme Edition汽车平台。

高通芯片制程发展_高通芯片的架构_

在骁龙峰会上,理想展示了其智能座舱的一系列功能,从语音助手、出行助手到智能问答。

Snapdragon Extreme汽车平台是Snapdragon“数字底盘”解决方案组合中的最新产品。除了高算力芯片之外,高通还提供智能驾驶和AI软件栈系统,提供具有视觉感知的端到端智能驾驶系统。 、传感器融合、路径规划、定位和车辆控制等先进功能。

采用Oryon CPU的骁龙8至尊版发布后,再加上高通自研的Adreno GPU、Spectra ISP和Hexagon NPU,高通完成了自研SoC拼图的最后一块,统一了PC、手机和汽车。三个产品线的芯片架构。

自研芯片架构的意义在于能够根据不同产品线的需求,在微架构层面对CPU进行调优和定制。同时,高通的AI软件堆栈(AI Stack)在不同产品线的AI部署中也发挥着重要作用。

至此,纵向从芯片、大模型到应用,横向从手机、PC到汽车,高通已经实现了AI能力的全链接。

正如大型模型公司通过新技术优化不断降低大型模型的使用门槛一样,高通的布局正在帮助众多OEM厂商和应用公司将越来越多的生成式AI技术从不可能变为可能。

生成式人工智能可能“无处不在”

现在随着大模型的落地,人们越来越注重端侧能力的体验。

从AI技术领域研究“小模型”(SLM)的趋势开始,在科技公司的努力下,端侧模型已经逐步从文本到图像再到多模态一步步实现。如今,高通端侧芯片的AI能力、完整的开发平台和统一的生态系统,为生成式AI的大规模应用铺平了道路。

然而,高通的“极限版”芯片只是一个起点。通过全链路技术的推广,我们也将见证在不久的将来很多事情都会发生改变。

事实上,我们已经在近期的发射活动中看到了端倪。在《永恒之劫》手游测试版中,骁龙8至尊版不仅利用CPU和GPU的能力带来高帧稳定的游戏体验,还运行了18亿参数的大语言模型在设备端。结合高通对AI软件栈从硬件到软件的全栈优化,网易直接打造了手游设备端的AI队友功能。

高通芯片的架构_高通芯片制程发展_

现在,玩家在游戏中拥有可以进行语音交互的AI队友。他们不仅可以在战斗中听取玩家的指令,还能在你不知道该怎么做时提示你。

如果我们在手游等高耗能应用中已经能够负担得起大模型代理,那么在日常应用中,AI代理可以为我们搭建桥梁,让很多功能实现高度自动化。 ,甚至消除应用程序之间的障碍。扩展到人工智能电脑、汽车甚至机器人,高通的技术堆栈或许能够将不同的硬件连接到一起。

正如奥特曼所说,高通在所有边缘设备上都拥有强大的技术,可以应用人工智能模型将全球数十亿用户聚集在一起。这只是生成式人工智能的开始,未来会发生什么?是时候发挥你的想象力了。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/271799.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息