作者|云鹏
编辑|漠影
DeepSeek 的火爆给全球 AI 产业发展带来了诸多核心价值,其中之一便是极大地推动了 AI 应用的普及。尤其在国内市场,几乎各类产品都在不断增加与 AI 能力的融合。
这意味着 AI 大语言模型不再仅仅局限于云端而在天上飞,而是能够切实地落在我们身边生活的设备上,迈向边缘和端侧。IoT 市场作为边缘智能的典型领域,成为这波边缘 AI 的重要关注点之一。
今天,AI 技术在快速发展。IoT 等边缘 AI 领域也开始涉及更复杂的算法。并且涌现出了更多的边缘 AI 推理需求。于是,应用对计算性能的需求越来越高,对算效比的需求也越来越高。与此同时,数据安全问题越来越凸显。
AI 技术在智慧城市、智慧工业、智能家居、智能穿戴以及新零售等领域广泛应用,这带来了 AI 计算需求以及安全性方面的新挑战。面对这些新的挑战,行业正在呼唤新的解决办法。
昨天,Arm 发布了一个全新的东西。这个东西是全球首个专为物联网进行优化的平台。它以全新的 Cortex - A320 CPU 和 Arm Ethos - U85 NPU 为核心。它是一个 Armv9 边缘 AI 计算平台。它不是 CPU 和 AI 加速器的简单叠加。它实现了 CPU 和 NPU 的深度融合,并且两者相得益彰。它是一个解决方案。
这是 Armv9 架构的诸多优势特性首次在 IoT 市场得以落地。它在效率方面进行了升级,直指当下边缘 AI 的新需求;在性能方面也有升级,同样直指当下边缘 AI 的新需求;在安全方面同样进行了升级,也是直指当下边缘 AI 的新需求。与此同时,Arm 把软件层的 KleidiAI 拓展到了 IoT 领域,从而使边缘 AI 的开发进一步得到了简化。
Cortex - A320 怎样去解决以 IoT 为代表的边缘 AI 领域的行业需求痛点呢?Armv9 带来了哪些关键的技术升级呢?在软件层面的新进展又是怎样加速 IoT 领域的技术创新以及应用落地的呢?我们将努力去找到答案。
一、边缘AI风暴来袭,算力和安全成两大IoT突出难题
近年来,AI 技术不断发展且被广泛应用,计算需求迅速增长。越来越多的 AI 工作负载开始从数据中心和云端转移到边缘侧进行处理。这给人们的生产带来了实际的益处,也给人们的生活带来了实际的益处。但与此同时,也带来了计算性能方面的瓶颈问题以及安全方面的挑战问题。
在工业质检领域,AI 视觉质检系统若能使产线漏检率降低 1%,或许能带来千万级的成本节约。然而,在复杂的工厂条件下实现这 1%的小目标,从技术层面来看并非容易之事。在汽车行业,自动驾驶与驾驶员的生命安全紧密相关,其成功应用需让激光雷达、摄像头等传感器的数据在 100ms 内融合并被模型处理。
在智慧医疗领域,边缘 AI 系统能够实时分析监护仪数据,进而预警相关病症的早期症状。这一过程的高效性和精准性,对底层芯片的性能表现有着高度的依赖性。如果算力不足,就会导致预警延迟,并且会使预测准确率下降,这些情况都会极大地影响到病人的健康。
未来,AI 高清视频实时分析、AI 工业设备故障检测等复杂任务的需求在不断增多。在这种情况下,边缘 AI 计算能力的重要性越发凸显出来。IoT 领域正期待着从芯片架构到算法层进行全面的革新,只有这样,才能真正释放出 AI 所带来的革命性潜力。
边缘 AI 的发展除了在计算性能、效率方面,还带来了数据安全层面的风险。在边缘计算中,因为有越来越多的边缘 AI 设备接入网络,所以数据会在边缘设备与云端或者其他边缘设备之间进行传输,而这样就容易遭受网络攻击。
因此,面对边缘 AI 的迅猛发展,边缘设备需要具备更强的推理能力。同时,边缘设备也需要具备更安全的计算架构。
从行业的角度来看,传统边缘侧设备所使用的芯片不能够满足越来越多的实时 AI 处理以及计算密集型推理任务。
在昨日的 Arm 新品发布会上,Arm 物联网事业部业务拓展副总裁马健提及,近期她与众多合作伙伴就边缘 AI 进行交流,大家反馈一致,即 AI 会让他们重新规划产品设计,要么加入具有 Transformer 加速功能的 AI 加速器,要么采用更能支持 AI 的 CPU。
Arm物联网事业部业务拓展副总裁马健
IoT 产业对在边缘侧具备更高性能的 Cortex - A 级别计算能力有突出需求,对升级至 Armv9 架构也有突出需求,Arm 的边缘 AI 平台新品正契合这些需求,可说是直指痛点。
10 倍 AI 计算性能,通过异构计算来扩展场景适应力,并且支持 Armv9 的四大安全特性。
在这样的行业背景之下,Arm推出了首个基于 Armv9 架构且专为边缘 AI 而设计的 Cortex - A CPU,即 Cortex - A320。同时,还推出了一个边缘 AI 计算平台,该平台结合了 Cortex - A320 与 Ethos - U85。
Cortex - A320 在 AI 计算性能和能效提升方面表现出色。它与 Cortex - A35 相比,最高可实现 10 倍的 AI 计算性能提升。同时,与 Cortex - A53 相比,也能有 6 倍以上的提升。这些提升对于增强边缘设备的推理能力而言是非常关键的。
Cortex-A320 的能效提升比 Cortex-A520 能达到 50%。在相同芯片面积的情况下,Cortex-A320 比 Cortex-A53 的性能提升 15%。Cortex-A320 相较 Cortex-A35 有 30%左右的性能提升。
这样的性能与能效提升在产业落地端到底能够引发怎样的改变?
用一个贴近日常的例子来讲,Cortex-A320 和 Cortex-M 系列相比,在内存寻址能力方面有显著提升,在整体性能上也有提升,在安全防护上同样有提升。这就让它可以很好地支撑起多种人机交互场景,尤其是对视频流等视觉交互应用的支持非常出色。
在某个重要的展览会上,你偶遇了一位熟人,可一时记不起他的名字。这时,你的智能眼镜能够立刻为你识别对方并提供其信息,并且还能在你的视线中贴心地嵌入演讲要点,帮助你实现“即兴”发言。
技术不断进步,智能眼镜这类边缘设备正逐渐成为我们生活中的得力助手。它让我们能够释放双手,从而可以专注于更多想要完成的事情。
Arm Cortex - A320 带来的不只是技术参数方面的变化,在某些领域还能够带来商业模式的升级与重构。边缘 AI 的算力发生跃迁,其本质在于对人、机器与物理世界的交互范式进行重构。
除了性能和能效的提升,异构计算的特性支持也同样重要。
这次 Arm 的 Cortex - A320 与 Ethos - U85 NPU 共同构成了 CPU + NPU 协同计算架构,从而形成了完整的异构计算平台。要明白,Ethos - U85 属于 Arm Ethos - U 产品线中的第三代 NPU,并且是到目前为止性能和能效最为强大的 Ethos NPU。与上一代产品相比较而言,它的性能提升了 4 倍,能效提高了 20%。
任何开发者不希望在 Ethos-U85 上运行的 AI 操作,基于异构计算能力,可以回退到 Cortex-A320 上。利用 Cortex-A320 的 Neon/SVE2 引擎,能在 CPU 上更灵活有效地执行这些操作。
智能物联网可以在正确的时间运行最适合的工作负载,消费类电子生态系统也能够在合适的地方运行最适合的工作负载。
在 CPU 与 NPU 深度融合的情况下,新的 AI 计算平台能够覆盖更多的应用场景,能够实现包含视觉以及自然语言等在内的多模态的环境感知与理解,并且可以运行 AI 智能体、进行自主规划以及执行复杂任务。
机器学习计算性能提升了 8 倍,这使得它能够赋能边缘 AI 设备在本地运行超过 10 亿参数的大模型,从而让基于大模型的生成式 AI 更好地在物联网领域得以落地。
值得一提的是,当下 AI 大模型对内存访问性能有较高需求。Cortex - A320 支持更大的可寻址内存空间,并且能够更灵活地管理多层次内存访问延迟。同时,Cortex - A320 还可以运行功能更为丰富的操作系统,使设备管理更加灵活。
在安全性方面,Armv9能够支持 MTE,也就是内存标记扩展;还能支持 PAC,即指针认证;也能支持 BTI,即分支目标识别;并且可以支持 S-EL2 虚拟化。通过这些支持,能够给边缘设备提供端到端的安全防护。
整体来看,在硬件层面,Arm 的 Cortex - A320 以及 Ethos - U85 异构计算平台切实地帮助了企业应对性能、能效和安全等方面的边缘 AI 新需求。在 Armv9 架构层面,其诸多优势特性开始让 IoT 领域的企业在 AI 创新和应用落地方面获得加速。
据悉,这次 Arm 发布的边缘 AI 计算平台得到了研华科技的支持。
三、Arm软件大招落地IoT,边缘AI规模化应用提速
Arm 的完整解决方案包含的内容不止这些。硬件构成了基础,软件起到了加速器的作用,只有软硬件相互配合,才能更高效地应对边缘 AI 的痛点。此次 Arm 还将 KleidiAI 同步引入到了 IoT 领域,以此来加速 AI 应用在边缘的落地。
从行业发展来看,完善的软件生态能够降低开发者的门槛。并且,软件一直以来都是 Arm 计算平台中不可或缺的一部分。
前文提到边缘设备种类多,硬件性能和功能差异大。在这一场景下,出色的软件技术能够优化算法和模型,让 AI 模型可以在各种边缘设备上高效地运行。
边缘设备的计算资源有限。软件技术能够采取模型压缩、量化以及优化算法等方式。在确保 AI 性能的情况下。可以降低模型对计算资源的需求。从而提高计算效率。
KleidiAI 是一套计算内核,专为 AI 框架开发者而设计。它能让开发者在 Arm CPU 上轻松获取最佳性能,并且适用于各类设备。
去年初次面向终端市场亮相,之后又扩展至基础设施领域,如今 KleidiAI 进一步覆盖了 IoT 领域,为各个领域的开发者提供了所需的性能、工具和软件库支持。
简单来说,Arm Kleidi 软件库的核心作用是协助开发者使 AI 应用获得 Arm CPU 的加速。原因在于当前全球多数 AI 推理工作负载是在 Arm CPU 上运行的。开发者无需再去额外学习新的工具和技能,也无需进行复杂的集成工作,这样一来,IoT 应用的开发门槛和成本都得到了大幅降低。
在软件生态表现出色且开发工具丰富的支持下,Arm AI 计算平台的灵活性获得了极大的释放。
Arm 的 Cortex - A320 能够兼容 Linux 等多种操作系统,也能兼容 Zephyr 等操作系统,还能兼容 RTOS 等操作系统。它依托 Arm Kleidi,能够适配 Llama.cpp 等主流 AI 框架,也能适配 ExecuTorch 等主流 AI 框架,还能适配 MediaPipe 等主流 AI 框架,从而实现 70%的性能提升,这对于 AI 应用在边缘落地而言是极为关键的。
马健于发布会上着重提及,此优势致使 Cortex - A320 在诸多市场领域、应用场景以及操作系统当中皆具备更优的灵活性。对于合作伙伴而言,其选择空间得到了极大的拓展,在规划产品路线之时,也能够更优地适配不同的场景需求。
Arm Kleidi 此次扩展到了物联网领域,这使得 Arm 在 IoT AI 领域的技术优势得到了进一步增强,从而吸引了更多的开发者和企业,这些开发者和企业会基于 Arm 架构来开发 IoT 应用,同时也促进了上下游产业的合作与创新。
展望未来,Arm 的边缘 AI 计算平台在 IoT 生态系统中会起到极为重要的作用。各个细分市场都能从 Cortex - A320 里获得益处。Arm 给 IoT 行业带来了更多的可能性,也为 IoT 市场的产品和应用创新奠定了新的基础。
结语:IoT边缘AI提速,Arm软硬两手抓
近年来,Arm持续进行着平台化的转型。此次 Arm 发布了首个面向 IoT 的 Armv9 处理器 Cortex - A320,还发布了以 Cortex - A320 和 Ethos - U85 为核心的边缘 AI 计算平台。同时,Arm 将 KleidiAI 扩展到了物联网领域。这些举措无疑是通过软硬件的协同,为边缘 AI 的加速发展和应用落地增添了助力,也是 Arm 近年来积极扮演赋能 AI 在各领域落地的有力体现。
未来,AI 计算正在加速从云端向边缘发展。未来,边缘 AI 计算需求肯定会持续增长。正如马健所说:“AI 的未来在边缘,而边缘 AI 的未来属于 Arm。”我们将拭目以待。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274588.html