1. 首页>>分享

vivo执行副总裁胡柏山畅谈2024年AI进程、折叠屏市场及影像技术未来规划

对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见__对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见

2024年的最后一周,爱范儿等媒体来到vivo东莞总部,与vivo执行副总裁兼首席运营官胡柏山畅所欲言,畅谈市场格局、AI流程和应用,而关于vivo产品未来的方向和规划,包括对折叠屏市场的思考,对MR眼镜、人形机器人、AI眼镜的规划和看法,以及vivo的强项:影像。

对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见_对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见_

以下是产品层面的对话摘要(为方便阅读,对话已被爱范儿重新编辑):

长焦和视频还有提升空间,但手机AI还有很长的路要走。

问:您如何看待人工智能的现状? AI会取代影像成为未来手机第一卖点吗?旗舰手机的画质现在已经到头了吗?

胡柏山:我们先来说图像。我们的最终目标是取代单反相机使用的大部分场景。我说的是场景。所以它的天花板还是很高的。

之前也说过,X200 Pro的主摄像头在上一代旗舰上从1英寸缩小到了1/1.28英寸,但用户体验并没有下降。没有下降的原因是芯片处理能力和成像算法有了很大的提高。这说明一个问题。主摄像头的用户体验达到了不错的水平。如果我们给出一个分数,假设常规焦距的单反是100分,那么我们的主相机现在接近80到85分。

但在长焦和视频方面,与单反的差距还是比较大的。如果继续打分,主摄80到85,长焦60左右,勉强及格。

在演唱会场景中,10倍焦段下,我们的X200 Pro还是可以的。 20x的时候,也就是说,当你坐在外面的时候,晚上的拍摄效果可以清楚地看到这个人是谁,但是用户我还是不敢把照片分享到朋友圈,因为有点难用,但我可以使用它10次。

在长焦方面,我们的手机成像与单反相比还是比较远的。 3到5年内,vivo可以将长焦提升到80分的水平。这个机会仍然存在。虽然手机内部空间利用率已经达到了极限,但另外的提升空间在哪里呢?图像传感器的感光能力可以通过技术不断提升,大型模型和成像算法也可以得到很大的提升。这也是我对vivo未来长焦能达到80分充满信心的原因。

拍照是相对静态的,所以算法的作用范围会大很多,但视频是动态的,如果在视频中加入一堆算法,对功耗会有巨大的压力。当然,这里还有改进的空间。该芯片现在是3nm,下一代将是2nm。 SoC芯片,甚至专门的图像处理芯片未来都会得到改进。下一步我们也会在视频上使用大模型的算法能力,但视频整体逻辑是动态的,所以算法的加持能力还是会弱一些。

无论是长焦还是视频,距离满足用户的高要求还有很长的路要走。技术本身还有很大的发展空间,因此成像仍将是未来旗舰手机的重点。

说到AI,确实这两年已经产生了大型模型,而且AI还在快速发展。回到手机本身,AI仍然有其局限性。手机最大的问题是计算能力不足。我把手机AI分为三个阶段:

第一阶段是在过去的一些功能上增强AI能力。比如过去一段时间,整个手机行业最流行的就是AI淘汰。这个功能已经有十几年了,在函数技术时代就已经有了,但是当时算法比较底层,一直都是这么做的。不好。

过去,语音识别能力,采用深度学习方法,成功率可能只有90%。以这个成功率,你会发现对话好几轮都无法完成,而且每个环节的扭曲都太严重了。生成大模型出来后还是一样,语音识别能力和语义理解能力一下子就大大提升了。以前我们有一个功能叫电话秘书,最早是在NEX 3上推出的,人们一听就知道是传统AI做的,说几句话就挂了电话。现在因为AI的加持,短时间内谁都看不出是AI在说话。

这些都是基于某个功能或者某个模块的改进。它们与通用人工智能(AGI)不仅有一点不同,而且有很大不同。

第二阶段我认为是把大模型能力集成到系统中。比如,以前我们在寻找功能设置的时候,根本找不到,因为菜单选项太多,让人眼花缭乱。未来,AI与系统深度耦合,让手机清楚地了解你的意图以及下一步要做什么,让手机交互更加智能。比如我们刚才尝试的“原子岛”就是知道你的意图并提出解决方案。这个阶段会运行比较长的时间,因为这个阶段的用户体验和现在的计算能力还勉强能够满足。

第三阶段就是我们在 VDC 2024 会议上所说的 PhoneGPT。我们当时演示的功能是叫外卖,我们说是成功的。事实上,每一步的成功率只有85%。走了三步,就再也跑不动了,而且需要很长时间。这种体验只是一个模型,用户体验一点也不好。

要真正实现PhoneGPT的要求,算力要求不是增加一点点,而是增加很多倍。目前的集成架构、封装架构、带宽都不够。对于真正的PhoneGPT来说,整个能力要求是目前的高速存储、服务器端能力、带宽能力、SoC架构必须接近服务器端才有机会实现。

这就像图像一样。我们可以看到用户的需求已经产生了。许多模型都在云服务器上运行。我们内部计算中心有近万张计算卡。很多模型可以在云端运行,比如A模型有130B参数,但这种规模无法在手机上运行。手机只能运行2B和3B参数。因此,我估计手机真正实现PhoneGPT需要不到五年的时间,而且还达不到用户体验要求。

AI赛道目前正处于第二阶段。这是一个逐步的改进,而不是0到1的改进。所以,目前AI对于整个换机浪潮的推动力并不大,因为用户感受不到从0到1的突变,只发生从0到1的突变。当用户发现PhoneGPT可以做这么多事情时,他们就会产生强烈的更换手机的欲望。

因为我既负责产品,又负责技术,所以我披露的应该是我们现在的技术水平或者整个行业的技术水平。

Q:智能手机行业新生产力体现在哪些方面,哪些部分最为重要?

胡百山:手机产业是新质生产力最典型的代表。据我了解,新质量生产力体现了高技术、高质量、高动能的“三高”特征和“四个新”特征。如果按照这个标准来衡量,手机属于新生产力的典型范畴。我们看到这几年新技术在手机上不断迭代。

我们非常重视的两个赛道是影像赛道和AI赛道。在影像领域,过去五年左右的时间,大家已经能够感受到手机在各种条件下的拍照效果。这是一个快速进步的过程。

手机已经取代了我们过去使用的很多数码相机,包括一些场景下的无反光镜相机和单反相机。更多的消费者愿意为更好的摄影付费,也愿意付出更多。快来买部手机,拍出更好的照片。

我们将在2024年发布的X100 Ultra和X200 Pro,我们将其命名为“音乐会神器”,是一样的。近年来有很多演唱会场景。人们举办各种音乐会,消费者希望记住这个美好的时刻。为什么演唱会现场需要手机?单反相机无法带入演唱会现场,消费者只能用手机记录美好瞬间。

AI赛道也是如此。 AI刚刚起步,但实际上已经在很多赛道上为手机赋能。我认为毫无疑问,手机行业是新生产力的代表。我也相信,在未来很长一段时间内,手机仍将是核心的消费电子产品,能够贡献新的生产力。

_对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见_对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见

vivo MR原型机明年见 人形机器人成熟还需十年

Q:vivo在MR(混合现实)和人形机器人方面的进展如何?

胡百山:我们的MR跑得比较快。 vivo MR团队规模已达近500人。我们的目标进度是2025年9月或10月左右。高保真MR体验原型机将在全国十几个城市的vivo门店上架。上架体验。从开始预约到现场体验,形成标准化流程供大家体验。

在商业化方面,我们需要放眼整个MR生态系统。 MR生态仍然需要娱乐内容和游戏内容。因为vivo是一家比较纯粹的公司,不生产内容,所以内容取决于整个生态系统能否及时匹配。当然,大量信息表明该行业正在朝着有利的方向发展。腾讯将加大内容投入。过去,他们的想法是制造硬件。最近他们的想法不是做硬件,而是做软件。这对我们来说是一件大事。好东西。

我对MR团队的要求是,一定要找到我们认为更需要的场景。人群的细分点并不重要,但对于细分人群来说,MR是不可或缺的。

比如手机上玩的游戏或者主机上玩的游戏体验就是这个水平。 MR推出后,用户发现那些游戏都只是渣,体验得到了很大的提升。除了身上没有MR设备外,大多数时候,他们一有时间玩游戏就去找那个MR。这是他们刚需要的场景。

关于人形机器人,我们去年也提到过这个概念。大家都知道为什么会有这样的需求:社会老龄化越来越严重。

从趋势来看,机器人确实正在朝着一个方向发展。我们分析了机器人的一些关键路径,其中之一就是空间感知。 MR的空间感知能力非常强。 MR完成后,机器人的空间感知能力就不会出现问题。

对机器人的另一个要求是手脚要足够灵活,大脑要有很强的决策能力。因此,要实现大家理想中的机器人,我们自己的判断还需要十几年的时间。

空间感知能力和决策能力短时间内不会那么完美,但手脚的能力其实会提升得比较快,比如在特殊场景下执行特殊任务的工业机器人。

真正理想的机器人可能需要十年甚至十五年才能实现,但我们可以分阶段实施。例如,首先限定一个范围。产线机器人可能会做“两份工作”,但我们希望未来能做“十份工作”。 “直播”,我们也在建设这个能力,但是生产产品没有那么快。

我们目前的逻辑如下。这种机器人就是我们内部所说的场景需求、用户需求。需求和用户需求都比较明确,但技术解决路径并不完全清晰。就像我们之前谈到影像一样,用户想要的就是用标杆单反相机进行拍摄。机器人是用户场景需求足够明确,但技术不匹配的情况。在未来三到五年内,我们将弄清楚该技术的成熟状态。基于技术的成熟状态,我们可以在中间设立一个具有解决局部某些场景能力的产品。

说白了,我们要弄清楚未来三五年内技术会达到什么水平,包括AI能力。基于这个技术能力,我们在理想场景上进行一些裁剪,以满足特定场景的需求。这些是我们内部制定的一些产品周期。

问:AR产业链会更快成熟。您对此有何看法?

胡百山:我们是这样理解AR产品的。首先,从用户需求来看,眼镜不宜太重。带显示屏的 AR 眼镜非常重,有四十克或五十克。这种体验并不好。有些AR眼镜有一个显示部分,可以显示东西。数量相对较少。我们暂时没有做这个类目。我们会考虑不带显示屏的眼镜。

无论我们从事哪个类别,我们都必须找到我之前提到的迫切需要的场景。我们必须找到细分的群体。对于这一类别,它们是绝对必要的。前段时间,一个产品同事找我聊,我问有没有必要去找他​​们。有没有什么用户和场景?他说他找到了一部分,听起来很有道理。

因为很多用户在工作的时候双手就已经被占用了。另一个人站在后面为他服务怎么样?如果他一个人,双手被占用,就需要一个辅助装置来弥补那个场景。无论是手机还是其他设备都不能很好地解决这个问题。所以我们MR设备的定位逻辑是,这个东西对于那些人来说是迫切需要的、不可或缺的。我们找到了一些人群。如果产品快的话,应该会在2025年底出现,如果慢的话,会在2026年出现。

对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见_对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见_

折叠屏需求已经显现,产品节奏将发生变化。

问:连续四年增长的折叠屏手机市场却陷入停滞甚至下滑。 vivo对于折叠屏手机有何规划?

胡柏山:折叠屏一开始可能会被各个厂商寄予更高的期望,因为毕竟是产品形态的巨大改变。回到用户需求的角度,谁在使用折叠屏?

对于像我这样45岁以上眼睛已经开始老花眼的人来说,现在折叠手机解决了很多眼睛开始老花眼的问题。为了观看大量新闻或视频,他们需要更大的手机屏幕。这解决了老年人的问题。需要。

第二类人就像这里所有的媒体人一样,他们都使用折页机,要处理大量的信息,包括我自己,要处理大量的公司电子邮件。

直板机首先垂直地处理信息,当你点击它时,你必须水平地转动它。这个体验不好,而且字体比较小。

无论是哪个品类,都解决了细分群体的需求。为什么我说做产品的时候,我们也要搞清楚哪些用户是急需的。 Folding刚问世时,大量用户抱着尝试新事物的态度。他们之前从来没有用过,所以他们尝试着使用,但是使用之后却发现,这并不适合他们。

我有朋友说,手机除了看微信、打电话、发短信,剩下的就是刷抖音了。抖音依然是竖屏。折叠屏对他根本没有任何影响。他绝对不会为他的下一部手机购买折叠屏。

经过前期的发展,折叠屏剩下的就是刚需用户。刚才提到的两类用户是那些想要尝试新事物的用户。第一类和第二类用户的市场容量其实并没有那么大。而且,在很多场景下,比如游戏场景,折叠屏肯定不好用。它的散热环境比直板机差,操控体验也不如直板机。因此,折叠屏成为了细分人群的产品。这个市场的总规模取决于该人群的规模。未来可能会稳定在500万台左右。

对于我们来说,我们应该这样做吗?去做。因为根据用户需求有不同的人群,但我们要控制它。我们一次性做了两款,比上一代有很大折扣,一款主打成像和性能,一款主打性价比。我们本来计划卖几百万台,但最后我们发现我们还是做到了。几十万台,这个规模还是有限的。通常,我们每年都会迭代一次。我们将按照这个速度前进并改善用户体验。毕竟总会有一些用户只需要Folding。例如,有些用户用一部手机处理日常微信和社交互动,用另一部手机阅读股票行情。批准文件。

另外,就小型折叠产品而言,2023年全球小型折叠产品将增长。2024年,行业领先品牌的小型折叠产品将下降30%至40%。 vivo未来应该不会推出小型折叠产品。

_对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见_对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见

旗舰机的价格还会继续上涨,但次旗舰机的体验已经相当不错了。

问:今年旗舰手机价格略有上涨。明年还会继续涨价吗? vivo如何平衡成本和价格?

胡百山:我们判断价格上涨可能会持续。价格上涨有两个因素。第一个非常清楚。旗舰SoC平台和半导体制造工艺将得到改善,因此价格持续上涨是肯定的。它们都会增加。我们也在尽力与SoC厂商进行谈判,价格不能提高太多。比如,如果他们要牺牲毛利率,我们也会牺牲一点毛利率来维持涨价。或者说涨价慢一点的话,就是500,我们就涨300,明年再涨200。

第二个包括刚才提到的图像,比如长焦,距离80点还很远。我们每年都必须继续投资。虽然空间不变,但实现方式,比如镜头的排列、模块的实现等都会发生变化。大变化。重大变更后,良率会下降,每件产品的成本会增加。

旗舰手机价格上涨是必然趋势。对于大多数普通用户来说,(现在的次旗舰手机)做得更好。比如在N-1平台(使用上一代旗舰芯片的次旗舰手机)上,用户体验相比原来有了很大的提升。我们未来的旗舰影像也可能会部署在N-1平台产品上,以满足用户购买力的问题。

说白了,如果用户想要追求极致的用户体验,影像、AI、游戏上的极致体验,对不起,还是要多付五百块钱。不追求极致的体验,只是一般的体验,好吧,N-1平台也有很好的外观,当然它没有这么极致的体验,但对于用户来说,他们不想玩最强大的游戏,就玩原神,N-1平台绝对没有问题。拍照时,如果你不追求20倍长焦去演唱会,但如果你追求10倍,我们X系列的常规型号也能更好地满足你。

所以购买力强、对体验有极致追求的用户会走得更远,但我们当中肯定会配置一些价格合适的产品和体验更好的产品来满足用户的需求。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273785.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息