1. 首页>>分享

WISE2024商业之王大会:探寻中国商业韧性与新动能

环境在不断变化,时代也在不断变化。 “商王”顺应时代潮流,坚持创造,寻求新动能。立足中国经济大转型的现状,WISE2024商王大会将发现真正有韧性的“商王”,探索中国商业浪潮中的“正确的事”。

11月28-29日,为期两天的36氪WISE2024商王大会在北京隆重举行。作为中国商业领域的全明星盛典,WISE大会今年已是第十二届,见证了日新月异的时代。中国企业的韧性和潜力。

2024年是一个有些模糊、变化多于稳定的一年。与过去十年相比,大家的脚步都在放缓,发展也更加理性。 2024年也是寻求经济新动力的一年。新的产业变革对各学科的适应性提出了更高的要求。今年WISE会议的主题是Hard But Right Thing。 2024年,什么是正确的事情成为我们想要更多交流的话题。

在上午的WISE大会上,智普CEO张鹏就近期人工智能的热点话题以及人工智能发展的阶段进行了题为“GLM大模型与通用人工智能”的演讲。

智浦AI是国内大模明星初创公司。早在OpenAI的ChatGPT推出之前,当国内深度涉足大模型领域的人还不多的时候,智浦AI就已经开始了对大模型的探索。

作为通用人工智能的重要基石,GLM大模型不仅集成了深度学习强大的计算能力和泛化能力,而且在语义理解和知识推理方面表现出了优异的性能。

张鹏在演讲中不仅回顾了人工智能领域发展的经典曲线,还对大模型领域的Scaling Law、大模型发展的滞后等近期热点话题进行了阐述。

张鹏表示,本质上,从研究和技术角度来看,这一代大模型并不像上一代人工智能技术。随着语言能力的大幅提升,视觉、听觉等其他模态的大型模型仍有相当大的发展空间。

“大量的研究人员正在取得新的突破,每一个新的突破都会带来一些新的机遇。我们担心会撞到天花板或南墙。这件事确实有点为时过早。”张鹏说道。

此外,张鹏还提出了人工智能的五个发展阶段,包括语言能力、逻辑思维能力、工具调用能力、自学习能力等。

传智播客张鹏__张鹏王新成

张鹏

以下为张鹏演讲实录:

张鹏:大家下午好!已经12点多了,虽然外面很冷,但里面还是很热闹。你现在还在这里听我说的话,应该是真爱吧。

今天来这里的路上,我就在想我该和你聊点什么。我们的市场部要求早点制作并交给我们的主办方。也许里面的内容还是我们之前准备好的。

这两天大家也一直在讨论一些新的事情,包括缩放法则是否已经到了天花板,大模型的事情会不会继续下去。意见有很多,也不断有人问我这样的问题。所以我不一定会关注这里面的所有内容,但是我们跟大家聊聊我们最近的思考。

这是关于今年年中发布的人工智能曲线。可以看到有很多与人工智能、大语言模型相关的词语。这些话在里面的位置不同,也代表了公众对此事的态度。注意力。我个人理解,它越来越像舆论和媒体热情的曲线,而不是真正的技术领先的曲线。

正如你所看到的,这里面有很多新的东西,包括体现智能、智能代理等技术,这些技术仍然处于非常快速的上升曲线。因此,从这一波人工智能发展来看,目前还处于非常快速的成长期。

因此,大家都担心整个行业会因为规模法则而突然进入低谷。这种担心或许有点多余。就像我们担心人工智能会统治人类一样,现在还为时尚早,所以我们不妨让子弹再飞一会儿。

从非常狭义的意义上来说,缩放法则确实存在一些挑战。你可以看看这个曲线。在语言能力方面,大模型确实已经达到了上一代人工智能遇到的天花板问题:所有能力都接近人类的极限和人类专家能够评估的极限。 。

大家可以回忆一下,上一代人工智能之所以进入发展瓶颈期就是因为这个。我们人类没有办法教人工智能如何突破。我们人类的天花板就在那里。所有输入人工智能的数据都来自人类。是否有可能突破这个天花板?这可能是现在大家都在思考的问题。

这是从语言模型的角度来看的。但本质上,从研究和技术角度来看,它并不像上一代人工智能技术。

上一代人工智能技术的底层神经网络、卷积神经网络等现在看来都比较简单。基本上,大家都很快收敛,稳定下来。

然而,预训练模型或者大规模训练模型底层的研究仍然迭代非常快,还存在很大的空白。一大批研究人员正在取得新的突破。每一次新的突破都会带来一些新的机遇。我们担心触摸天花板或南墙确实有点为时过早。

我们刚才讲的是语言模型。语言模型确实遇到了非常现实的问题。数据似乎被输入进来,智力提升的速度也慢了一些。但除了语言之外,还有很多东西,比如视觉、听觉。这些空间还是非常非常大的。

比如视觉理解方面还有很多问题需要研究。对于人眼看到的复杂场景,目前的模型还不能很好、全面的类比,与人类的差距还是非常明显的。我们在这里还有很多事情要做。

我们最近在这方面也花了很多功夫,把我们的视觉理解能力和硬件、端侧设备结合起来,让端侧设备有更强的理解能力。因为现实世界中的许多任务需要结合不同模态信息的输入,包括语言、视觉和听觉。

总结一下,我们可以看一下这张图。我们将人工智能的发展阶段和进步阶梯分为五个层次。事实上,OpenAI也有类似的分类。

在我们的理解中,前三个层次与OpenAI非常相似。首先,最简单也是最重要的是语言能力,以及其他模态能力,我们统称为多模态能力——视觉、听觉和大量空间。

第二个层次,逻辑思维能力,也是最近大家都在谈论的OpenAI的o1。我国也有很多团队正在加强推理能力,复杂问题解决能力的模型也在不断进化。就逻辑推理能力而言,我们大概可以达到接近人类水平的60%。

再往上,如何才能让大型模型和AI长出肢体,使用各种丰富的工具,产生更大的生产力,那就是调用工具的能力,这也是最近的热门话题。

我们最近也取得了一个小突破,让代理可以帮助人们操作手机上的应用程序和PC上的应用程序,解决一些重复性和程序性的任务。

再往上看,可能会有细微的差别(与 OpenAI 相比)。我们认为第四级和第五级是AI的自学习能力。

人类的能力、人类的智能之所以能够不断更新、迭代,就在于人类具有自我学习的能力。人们可以通过不断的实践和反馈不断提高自己,创造新的数据、经验、智能和工具。这些能力是人类前进、创造新事物的核心能力。

我们希望AI能够拥有更强的自学习能力,这样它就能突破现有的天花板,像人类一样创造出新的事物。未来,我们可以利用这种能力去探索、研究、寻找新的科学边界。

我们最近做的一件事就是研究如何将多模态能力中的视觉、听觉和声音能力结合起来,再加上非常强大的语言理解能力,来解决一些现实生活中的问题。

OpenAI对于人工智能发展的分层发展流程被称为通向通用人工智能之路。可以看到清晰的进化路线。从大语言模型到多模态,到工具的使用,到自学习,我们可以看到整个路径是非常清晰的。

为什么会发生这种情况?语言是基础。人脑智能是多模式的。然后我们利用工具连接物理世界,最终实现自学。

我们与脑科学研究专家、神经科学专家和其他跨学科专家进行了一些讨论。人工智能技术的发展现在已经触及通用人工智能的某些方面。

人脑分为多个区域并且是多样化的。这是现代脑科学所证实的,包括语言能力、逻辑推理能力、视觉能力、触觉能力、运动能力等。彩色部分其实是AI或者大型模型已经接触到的部分。灰色部分是我们还没有接触过或者比较小的部分,包括使用手脚等外部工具的能力。就像我们刚才画的梯形图一样,在理解和使用自然语言方面,已经接近人类的最佳上限。

我们在逻辑推理、情感、创新、工具运用等方面也取得了一定的突破,但有些地方还存在很多差距。那么下一代的Scaling law到底是什么?我们可能会在这些空白领域或尚未完全发展的领域中找到更多可以发挥尺度法则作用的地方。

在这个过程中,我们可以发现智浦的发展路径其实是对标OpenAI的。对比OpenAI就是我们的理念非常相似。我们认为,人类智能或者通用人工智能绝对不是单向能力上限的突破。

大家想一想,上一代人工智能,无论是NLP(自然语言处理)还是计算机视觉,单向突破能力上限最终的结局会是什么?它仍然是一个基于工具的成果,无法解决我们在现实生活中期望解决的普遍问题。它只能利用大数据来解决小任务。

这一代生成式人工智能或者大型模型能够解决的问题正是其他问题。我使用大数据、小任务、简单任务进行训练,以解决更多问题。这就是这一代生成式人工智能。待解决的核心问题。

但要解决多样化的问题,必须是多项目能力的结合。很难想象,每个人在日常工作任务中,或者在社交生活中,只使用一种感知能力。

解决现实生活和工作中的问题必须是多种能力的结合,这就是为什么我们要做多种类型、不同方式、多种能力的综合结合。

我们8月份发布的新一代车型是一个包含各种功能组合的产品矩阵。以文本能力为最佳基础,结合视觉、语言和编码能力,使其全面、通用。面对一般任务的能力。

8月份我们还接受了产学界、社会公众的公开评估和检查,结果非常好。第四代车型与世界一线车型竞争,这是我们非常高兴看到的。

在此基础上还会有更新的能力,比如视频生成能力。我们进行了全新升级,具有更高的码率、每秒60帧的视频生成、更高的4K清晰度、更真实的画面。 ,还可以结合我们的语音功能来自动配音视频。

众所周知,电影从无声电影到有声电影的进步是电影史上非常重要的飞跃。视频的生成从完全无声的画面到能够同时生成配音也是一个巨大的进步,这意味着我们正在朝着认识和了解物理世界又迈出了一步。成为向前迈出了一步。

不仅可以生成更高清的视频,而且视频比例更高,生成速度更高,可以同时多通道生成多个视频,让大家效率更高。

这就是AutoGLM,它让每个人都体验到用语言和语音控制手机的能力。相信关注我们的朋友最近也看到过这样的视频介绍,体验过我们相应产品的内部测试。

我们的产品发布后,受到了广泛的关注,过程中也确实给了我们很多反馈,虽然还是比较早期的尝试。经过这一个月的测试和反馈,我们努力继续迭代这个产品。如果您有兴趣,可以继续关注。我们还将向所有人开放新的更新。

由于时间关系,给我的时间较少,所以我们不会完成这个视频。如果您有兴趣,可以亲自体验一下。

通过强化学习的路径,我们让大模型变得像人脑一样,使用工具的成功率也得到了很大的提高。我们认为一般任务原来的成功率可能只有20%左右,但现在已经翻倍到接近40%。准确性。

未来,我们希望利用我们综合的模型能力,多模态、跨模态、通用的AI Agent能力,连接大模型大脑和更多智能设备,让AI能力更快落地,进入物理显示的世界,带来人机交互新体验。

我感觉这个时代即将到来。在此过程中,智浦也秉承两轮驱动理念,不断在技术上突破。同时,它也不忘记将我们的技术转化为更新的产品,为市场上的每个人创造更多。客户价值。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/272723.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息