春节期间,DeepSeek 开源大模型吸引了全球的目光,在国内引发了算力产业链的共振。云服务企业开始陆续进行部署,国产芯片企业也纷纷开始适配。今年的政府工作报告中首次提及“支持大模型广泛应用”。那么,怎样提升大模型的能力呢?又如何充分释放它的技术势能呢?全国政协委员曹鹏向《中国电子报》记者表示,大模型的能力要进行升级,其应用部署也需要开展。这需要整条算力产业链共同参与进来,尤其要在底层算力的建设方面发力,要开放智算配额,还要在核心场景上做深做透。
曹鹏觉得,DeepSeek 在国产化算力产业链方面的影响展现为两个方面。
DeepSeek 支持国产芯片适配。这一举措能够减少大模型应用对单一硬件生态的依赖,同时也能让国产算力实现从“可用”到“好用”的转变。
一是大幅提升了推理效率,DeepSeek 在参数量相同的情况下,推理速度提升了 30%到 50%。这使得很多中小企业以及开发者能够以更低的成本来调用先进的模型能力,进而推动了 AI 应用从“大厂专属”朝着普惠化的方向发展。
曹鹏所在的京东云主要覆盖智算产业链的中间层和上层。DeepSeek 爆火之后,下游产业和企业都有部署 DeepSeek 以构建自己的“行业大脑”或“企业专家”的需求。最近一段时间,曹鹏带领团队着力加强云平台与国产算力的适配工作,并且针对不同用户的类型和需求,提供了 5 种 DeepSeek 的部署方式。希望低成本搭建 AI 应用的初创公司和开发者,我们可提供裸金属智算服务以及公有云 Token 调用这两种模式。金融、政府、企业等有“数据不出域”需求的用户,我们能提供大模型私有化部署,以实现“数据本地化、模型私有化”。
要在实体经济中兑现 DeepSeek 的技术势能,一方面需要算力产业链进行纵向协同;另一方面要横向打通不同的行业领域,并且吸引不同的市场主体参与进来。
曹鹏指出,智能算力产业包含三个层次。底层是由芯片、服务器等构成的算力基础设施企业。中间层为云厂商。上层则是 AI 应用或者解决方案提供商。要实现贯通全产业链、跨行业跨体系的创新,需要做好两件事。
首先要加强底层算力的建设。需要将更多的异构算力,像 CPU、GPU、FPGA 等高性能计算资源进行整合,以实现跨地域以及跨架构的协同工作。如此一来,不但能够提升计算效率,还可以大幅度降低成本,从而把智算的价格降下来。
其次是开放智算配额。通过政策引导,让更多企业能够负担得起参与到“人工智能+”的发展中来;通过链主企业开放智算配额,让更多企业能够参与到“人工智能+”的发展中来;通过云厂商开放智算配额,让更多企业能够参与到“人工智能+”的发展中来。
首先聚焦核心应用场景。企业在利用智能体升级业务过程中,需抓住占比 20%的核心场景,因为这些场景通常能够满足 80%的通用需求。不应只追求应用的数量,而应将核心场景做深做透,保证这 20%的应用切实做到“好用易用”,使企业在实践中能快速见到效果,如此才能真正促使智能体技术与各行业实现深度融合。
概括而言,要提升算力并且降低成本,同时聚焦于核心场景并且做好关键应用。只有这样,才能够让更多的企业一同参与协同创新,进而推动整个行业的进步。
作者丨张心怡
编辑丨诸玲珍
监制丨连晓东
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274815.html