1. 首页>>分享

科学家计算出人类学习积累上限,24小时学不停100年仅存4GB知识引思考

西风 一水 发自 凹非寺

量子位 | 公众号 QbitAI

24 小时一直学习且不会遗忘,然而一辈子也就只有 4GB 的“知识储量”吗?

科学家们进行了最新的研究,他们计算出了人类学习积累的上限。这个上限就是这么多。甚至它还不如一块 U 盘能够装载的内容多。

_加州理工杰出校友_加州理工教授

这是一项工作,来自 Cell 旗下的神经科学顶刊 Neuron 。这项工作提出了一个悖论,这个悖论发人深省 。

人类信息处理速度比较慢,仅为每秒 10bit。然而,我们的感官系统的能力很强,能够以每秒 10 亿 bit 的速率来收集数据。

按照每秒 10bit 的速度来计算的话,人类如果 24 小时不间断学习并且不遗忘,那么 100 年所储存的知识仅仅是 4GB。

什么概念呢?来和大模型做个对比:

大语言模型中,每个参数能够存储 2bit 的知识。一个拥有 70 亿参数的模型,就能够存储 140 亿 bit 的知识。

加州理工教授_加州理工杰出校友_

华人学者朱泽园的“Physics of Language Models”系列论文得出了该结论

难怪研究人员还提出了一项推论:

算力持续提升,那么机器在各类任务中的表现超越人类只是时间上的问题。

马斯克目前的脑机接口研究按照这项研究的结论来看也存在问题。

研究人员表示:

我们预测马斯克的大脑与计算机的通信速率大概是 10bit/s。相比使用 Neuralink 的电极束,直接使用电话更好。因为电话的数据传输率是经过设计的,它与人类语言相匹配,而人类语言又与感知和认知的速度相匹配。

加州理工杰出校友__加州理工教授

一时间,这一系列惊人推论在学术圈各大社区引起广泛讨论。

美国的知名医师科学家 Eric Topol,他是斯克里普斯转化研究所的创始人,也忍不住参与其中并进行转发。

为啥我们一次只能思考一件事呢?

_加州理工教授_加州理工杰出校友

所以,结论如何得出的?

中枢神经系统“串行”影响信息处理速率

简单来说,要计算人一辈子能学习的知识量,首先得从大脑处理信息的速度开始说起。

从对打字、说话演讲、拧魔方等几项日常活动进行评估来看,他们初步得出一个结论,即大脑处理信息的速度约为 10bits/s。

人类打字为例的话,高级打字员每分钟能够打出 120 个单词,也就是每秒能打 2 个单词。通常每个单词按 5bit 来计算,这样一来,信息传输速率就是 10bits/s。

加州理工教授__加州理工杰出校友

同样,以英语演讲为例。如果把节奏控制在舒适的程度,也就是讲话速度为每分钟 160 个单词。那么信息传输速率为 13bits/s,并且略高于打字。

比如“盲拧魔方”这项竞技活动,选手首先要观察魔方几秒钟,接着就闭上眼睛进行还原。就以一次世界纪录的成绩 12.78 秒来说,其中观察阶段大概是 5.5 秒。因为魔方可能的排列数大约是 4.3 乘以 10 的 16 次方,约等于 265,所以最终的信息传输速率大约是 11.8 比特每秒。

作者使用类似的方式,估算了从经典实验室实验到现代电子竞技等更多场景下的信息处理速度,结果显示其在 5 到 50bits/s 之间。

加州理工杰出校友__加州理工教授

人类思考的速度始终是在 10bits/s 的尺度这个范围内。

按照这一标准,假如我们能够活到 100 岁,并且每天 24 小时都在不间断地学习,同时剔除遗忘的因素,那么我们最终所拥有的“知识储量”也将不会超过 4GB。

加州理工教授__加州理工杰出校友

事实上,人类感官系统收集数据的速率约为 10 亿 bits/s,而 10 bits/s 与之形成鲜明对照。

10bits/s VS 10亿bits/s

具体而言,我们每天从周围环境获取信息的速率是从以 Gbps/s 为起始的数值开始的。 我们每天从周围环境获取信息的速率起始于 Gbps/s 这个量级。 我们每天从周围环境获取信息的速率是以 Gbps/s 为起始来计算的。

举个例子,在视觉系统里,单个视锥细胞能够以 270bits/s 的速率来传输信息,并且一只眼睛大约拥有 600 万个视锥细胞。

双眼视觉系统接收信息的速度高达 3.2Gbps/s。由此推算,我们接收信息的速度与处理信息的速度之间的差距比值达到了 108:1。

加州理工教授__加州理工杰出校友

人类大脑里的神经元数量超过 850 亿个。其中三分之一集中在大脑皮层,进而组成了复杂的神经网络。这意味着单个神经元能够轻松处理超过 10bits/s 的信息。

现在所观察到的现象与之前的情况不相符。很明显,这两者之间存在着某种矛盾。

神经元本身的性能方面,它们具有能够快速处理和传输信息的能力。然而,这一能力并没有直接转变为整体认知速度的提升。这表明存在着其他的因素正在发挥作用。

那么,为什么人类信息处理速度如此之慢?

加州理工杰出校友__加州理工教授

按照论文分析,原因可能在以下几个方面:

中枢神经系统在处理信息时主要采用的是串行方式,并且这种方式会对信息传输速率产生限制。

这里要提到并行处理和串行处理之间的区别。

所谓并行处理,指的显然是多个任务同时进行。比如我们看东西的时候,视网膜每秒能够产生 100 万个输出信号,并且每一个这样的信号都是视网膜神经元对视觉图像局部进行计算后所得到的结果,通过这种方式就能够同时处理大量的视觉信息。

在中枢神经系统中,他们观察到了一种“心理不应期”效应。这种效应表现为,当同时面对多个任务时,中枢神经系统只会将注意力集中在一个任务上。

他们进一步探究了“串行”出现背后的原因,其结论是这与演化过程早期的神经系统功能存在关联。 他们探究了“串行”出现的背后原因,得出的结论是该现象与演化早期的神经系统功能有关。 他们对“串行”出现背后的原因进行了进一步探究,结论表明这和演化过程早期的神经系统功能有联系。

那些最早拥有神经系统的生物,其核心是利用大脑来检测气味分子的浓度梯度。通过检测浓度梯度,它们能够判断运动方向,从而进行捕食和避开敌人。长此以往,这种特定的功能需求使得大脑逐渐形成了“一次处理一个任务”的认知架构。

大脑的这种架构在进化过程中逐渐变得固定。物种在进化,大脑的功能也日益复杂,但早期形成的这种认知架构依然在一定程度上对我们同时处理多个任务以及快速处理信息的能力起到了限制作用。

此外,有理论称存在“注意瓶颈”等情况,对信息处理进行了限制。注意力在认知过程中很重要,它宛如一个瓶颈,既限制了能进入认知加工阶段的信息数量,又限制了其速度,然而目前人类尚未完全理解其具体的运作机制。

总之,依据论文的观点,10bits/s 这样的速度能够满足人类生存需求。之所以还存在庞大的神经元网络,或许是因为我们需要频繁地切换任务,并且要整合不同神经回路之间的信息。

马斯克脑机接口过于理想化

不过话是这么说,因为 10bits/s 与 10 亿 bits/s 之间存在巨大的差距,所以人类越来越难以忍受那种慢节奏了。

算力不断提升后,机器在各类任务中的表现超越人类只是时间层面的事情。

用今天的话来讲,以 AI 为代表的新物种很有可能会逐渐把人类给“淘汰”掉。

另外,论文还顺带调侃了马斯克的脑机接口系统。

其中提及,马斯克的行动是以肉体带宽的不足对处理信息产生了限制为依据的。依照老马的构想,一旦能够借助高带宽接口将人脑与计算机直接相连,那么人类就能够更加自由地与 AI 进行交流,甚至能够实现共生。

加州理工杰出校友_加州理工教授_

然而他们认为这一想法有些过于理想化。

大脑的基本结构决定了存在 10bits/s 的限制,并且通常情况下这种限制难以通过外部设备予以突破。

由此也提出开头提到的建议:

直接使用电话比使用 Neuralink 的电极束更好。因为电话的数据传输率已被设计成与人类语言相匹配,并且人类语言与感知和认知的速度也是相匹配的。

上述言论并非意味着他们对脑机接口失去信心。他们认为,关键不在于突破信息速率限制,而是以另一种方式提供和解码患者所需的信息。

作者之一为上海交大校友

这项研究是由学者完成的。其中一位学者来自加州理工学院生物学与生物工程系,另一位学者也来自加州理工学院生物学与生物工程系。

加州理工教授_加州理工杰出校友_

Jieyu Zheng 现在处于加州理工学院五年级博士研究生阶段。她是上海交大的本科校友。她拥有康奈尔大学生物工程学士学位。她在剑桥大学获得了教育与心理学硕士学位。

她的研究重点放在认知灵活性、学习和记忆方面。她特别留意大脑皮层以及海马体在这些功能里所起到的核心作用。当下,她正在开展一个项目,名为“曼哈顿迷宫中的小鼠”。

Markus Meister 是 Jieyu Zheng 的导师。他从 1991 年开始在哈佛大学担任教授。2012 年在加州理工学院担任生物科学教授。其研究领域是大型神经回路的功能,并且重点关注视觉和嗅觉的感官系统。

Markus Meister 在 1993 年获得了 Pew 学者的称号。2009 年,他因在视觉和大脑研究方面的贡献,荣获了 Lawrence C. Katz 神经科学创新研究奖以及 Minerva 基金会颁发的“金脑奖”。

新研究发布后,作者们就在X上当起了自个儿的自来水。

我们提出的特征是脑科学中最大的未解数值。

_加州理工教授_加州理工杰出校友

这一处理速度经过了同行评审。

_加州理工教授_加州理工杰出校友

随后学术圈各大社区也针对这项研究开始讨论起来。

有人认为论文读起来很有意思,发人深省:

简化内容并聚焦于中枢神经系统,将讨论内容分为内部和外部大脑两部分后,这样做更有意义。

加州理工教授__加州理工杰出校友

这是一个非常重要的视角,值得深思……

然鹅,也有不少人提出疑问。

我思考这篇论文中的某些估计时,越发产生怀疑。比如,关于打字员与听者之间比特率的等效性(S.3),看起来似乎存在错误。就像香农所表明的那样,英文字母的熵大概是每字符 1bit。然而,要是涉及一连串的单词或者概念,那情况又会是怎样的呢?

加州理工杰出校友_加州理工教授_

作者默认了每秒 10bit 是慢的这一假设。我们在硅基底上实现的通用计算系统与之相比的确很慢。但这种假设不能线性地转化为大脑的信息吞吐量和存在的感知。

加州理工教授__加州理工杰出校友

对于这项研究,你有什么看法呢?

论文链接:

[1]

[2](24)00808-0

[3]

[4]

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275418.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息