1. 首页>>分享

腾讯科技对话尤瓦尔·赫拉利:AI群体操控新阶段,人类秩序渴求先于真相

图片

腾讯科技《AI未来指北》特约作者 博阳

编辑 郑可君

近期,腾讯科技与《人类简史》的作者尤瓦尔・赫拉利开展了一场深入的对话。

人类对秩序有着渴求,这种渴求先于真相。这是互联网和 AI 能够控制个人的首要原因。

赫拉利在对话中着重探讨了人工智能对个体决策的影响,强调了其潜在性。同时,他表达了对技术被少数人掌控这一情况的忧虑。

然而,最新的研究表明,AI 的威胁已经远远超过了赫拉利之前的预判。在 2024 年 4 月发表于 arXiv 预印本平台的“SocioVerse”研究论文中,揭示出了一个更加严峻的现实情况:AI 技术已经突破了个体影响的范畴,进入到了群体操控的新的阶段。

图片

复旦大学主导了这项研究,并且联合了上海创新研究院、罗切斯特大学、印第安纳大学以及中国社交媒体平台小红书一起完成。通过构建一个以 1000 万真实用户数据为基础的社会模拟系统,这项研究展示出,AI 不但能够理解和影响单个个体,还能够操控成千上万的人,甚至可以预测并潜在地塑造整个社会的集体行为。

这种技术跃迁是从微观个体到宏观社会的。它让赫拉利的担忧显得保守,甚至几乎可以说是过于保守了。因为我们面临的风险比他当时所预见的要严重得多得多。

赫拉利担忧的是 AI 会成为精通心理学的个人操纵者。而“SocioVerse”表明,AI 正在逐渐演变成能够洞悉社会规律的超级架构师。它能够解码社会结构,预判群体动态,并且有可能改写社会运行的逻辑,成为一个数字巨灵。

这一技术跃迁把 AI 风险从微观个体层面提升到了宏观社会维度。它潜在冲击的深度和广度,比我们之前想象的要大很多。它潜在的后果非常深远,让人感到战栗。

SocioVerse:数字孪生社会背后的神秘面纱

SocioVerse想要构建一个全新的系统,这个系统是一个完整的数字世界,能够模拟和预测真实人类社会的行为。

二十世纪中叶的时候,社会学理论的奠基人亨普尔和欧本海默曾做出预言,那就是真正的因果解释一定要以社会现象的可预测性为基础。此后多年间,计算社会学在不断发展。然而,传统社会模拟技术一直存在根本性局限。这些局限表现为:要么过度简化了社会的复杂性;要么与现实世界严重脱离,无法捕捉到社会动态的瞬息万变、多元群体行为的差异,以及微妙的人际互动机制。

SocioVerse 诞生了,它彻底改变了这一局面。这个系统不再仅仅是对社会的简单模仿,而是成为了一个具有高度逼真度的数字镜像。

它整合了最前沿的人工智能技术,从而实现了对社会系统的全要素建模,这些要素包括:

动态演化的社会环境

具有独特行为模式的个体

复杂的社会互动网络

微妙的信息传播机制

这一突破让 SocioVerse 超出了传统社会模拟的范围,它成为了首个能够跟现实社会同步演进的数字孪生体。它的建模精度以及系统完备性,表明计算社会学研究达到了前所未有的程度。

用1000万个虚拟人,构筑一个流变真实的世界

SocioVerse 能算是能模拟这个社会的项目,原因在于它构建了一个能“以人类社会的方式运行”的社会模型,这个模型是一个具备时间性、个体性、情境性、互动性与变迁性的系统。这使得它既可以模拟社会行为,又能够模拟社会变迁。

在多数社会学入门课程里,教师会画这样一张图:有一些点,这些点代表个体;还有连接这些点的线,这些线代表关系。然而,这张图从未向我们表明,一个人转发某条微博的原因是什么,一个人开始焦虑地关注房价的原因是什么,又或者,一个人在看到“AI 裁员”的新闻时,忽然改变对技术态度的原因是什么。

人的行为并非在真空中产生。它处于事件的时间线上,在身份的社会结构里,于语境的交互场中发酵。社会并非仅仅是一堆人,而是一种信息的共振结构。

这是 SocioVerse 的起点。倘若我们要模拟社会,那么就不能仅仅模拟人,同时也要模拟信息,以及信息是如何穿透人群的,还有它是怎样塑造情绪的,以及如何汇聚成共识或者导致撕裂的。

他们设计了四个协作的引擎,分别是社会环境引擎、用户引擎、场景引擎和行为引擎。这四个引擎的协作,与社会结构中最核心的四个逻辑维度恰好相对应,即时间性,也就是事件如何演化;个体性,即谁在被影响;情境性,即在何种互动中;互动性,即如何相互作用。

图片

第一步,个体维度:从标签到人格的进化

SocioVerse 的用户引擎或许是其最具人类学方面雄心的部分。他们从 Twitter(X)以及小红书那里采集了超出 1000 万个真实用户的数据,还有超过 7100 万条社交发言。接着,用三个最为强大的 LLM(GPT-4o、Claude 3.5、Gemini 1.5)给每一个人进行打标签。

这些标签包含我们所熟知的人口学标签,例如年龄、性别、种族以及地区;在这一层面,基本上就是传统推荐引擎所能达到的极限了。

图片

LLM 的语义理解让这一系统能够给用户的政治倾向打标签,也能够给用户的消费偏好打标签,还能够给用户的价值观打标签。除此之外,他们能够对你的人格本身进行标记。在实验里,他们运用了 Big Five 人格模型(包括开放性、责任心、外向性、宜人性、神经质)来对智能体进行分类。甚至他们连智能体做表达的语义风格也可以进行分类模拟,比如它是更倾向于情绪表达,还是更倾向于喜欢逻辑分析。这一系统中的模拟人 Agent 获得了过往系统所没有的真实性。

完成这一系列打标之后,系统会把标签交给人工进行评审,接着将其训练成分类器,从而使整个用户库真正转变为一个鲜活的社会人群图谱。这些图谱涵盖:

基础属性:年龄、地域、职业等人口学特征

心理特征:大五人格特质(开放性、尽责性等)

行为特征:表达风格(如“理性分析型”或“情绪宣泄型”)

价值取向:政治立场、消费观念等深层倾向

这使得研究者能够精准地调用特定的人群画像,例如“95 后且对技术持乐观态度的程序员”,又或者“持怀疑态度的中年主妇”。

第二步,时空维度:动态演进的社会剧场

如果社会是一个系统,那么它首先是一个时间系统。人们的行为并非在“状态”里生成,而是在“进程”里发生变化。

为了达成社会的时间性变化这一目标,在构建完个人之后,SocioVerse 构建了一套被称作“社会环境引擎”的系统。

它实时抓取新闻事件、政策变动以及经济指标等数据,以此来构建持续演化的社会背景。拿美国大选模拟来说,系统不但输入候选人的政见,还将各州的失业率等经济数据、社交媒体话题的热度以及突发公共事件的影响进行整合,从而形成了一部每 24 小时就会更新的“社会纪录片”。

第三步,场景维度:情境敏感的行为模拟

首先是场景引擎。我们对于一个问题的回应,并非是孤立于上下文之外的“意见表达”,而是处于特定的语境之中。餐桌之上的谈话与问卷调查是不同的体验,微博发帖和面对面的访谈也是不同的体验。

SocioVerse 通过场景引擎来模拟不同行为发生时的“结构性环境”。

当模拟“选举投票行为”时,会选择匿名系统反馈。模拟“社交平台发言”时,需加入“会被谁看到”“评论如何反馈”的社交反馈机制。模拟“用户接受经济调查”时,要把问题置于是否信任问卷、是否担心隐私等背景因素之中。

在“国家经济调查”的模拟里,系统重建了一个问卷环境,这个环境与统计局高度一致,涵盖了食品、住房、医疗、交通、教育等八大项,并且还设置了不同的发放方式和媒介渠道。

结果显示,问卷从“政府官网”发出后,虚拟智能体的态度是普遍“慎重”且“合规”的。并且,他们在答题时更倾向于给出中性回答,也会更加谨慎地表达负面意见。

当同样的话题由“小红书推荐博主”发出时,虚拟智能体更倾向于将其视为“社交参与”或者“生活方式表达”。并且在回答中也更能真实地反映出支出方面的痛点,表达出焦虑或者消费方面的偏见,比如“最近医疗真的太贵了”“房租太高撑不住了”。

这意味着它模拟了信息裹挟的情境。并且不是仅仅用 AI 来模拟聊天。

第四步,互动维度:信息传播的连锁反应

情景造好之后,接下来就是通路模拟。信息开始进入通路,接着将“个体”转化为“彼此相关的个体”。SocioVerse把这个过程称作行为引擎。

这一引擎采用了双轨系统。对于像投票、选择、点赞这类规则清晰的群体性行为,SocioVerse运用了成熟的传统 Agent-Based Modeling(ABM)进行建模;而对于语言表达、态度生成、情绪反应等较为复杂的互动情况,会调用大语言模型来生成相关内容,并且会为每个 Agent 赋予其“人格+历史+信息输入+场景位置”,以此来生成其行为。

以特朗普发表演讲为例子,系统不但可以生成智能体对于该事件的初始态度,还能够模拟其在社交平台上的发帖行为、信息的传播路径以及所引发的连锁反应。从意见领袖率先发出声音开始,接着到普通用户跟风进行讨论,然后到观点对立导致舆论极化的出现,每一个环节都在算法的驱动下逐步递进,完整地重现了现实世界中热点事件从刚开始萌芽到最终爆发的整个生命周期。

值得注意的是,行为引擎的核心不是简单地复制行为。它构建了一个闭环的信息生态系统。在这个系统中,每个智能体的言论都可能经历一系列循环,如“传播-误读-再创作-扩散”。就像现实社会中谣言的发酵或热点的炒作一样,这会让虚拟世界产生与真实社会同步共振的舆论涟漪。

这个引擎名为行为引擎。SocioVerse 模拟的并非仅仅是行为,它模拟的更是一种信息循环机制。在这种机制中,行为会被看见,会被误读,会被引用,并且会引发反应。

社会环境引擎注入了实时事件,用户引擎定义了角色特征,场景引擎设定了交互规则,行为引擎激活动态反馈,四大模块共同驱动着 SocioVerse 的数字社会模型。

这个系统能够感知到时间的流动,能够识别个体的差异,能够还原场景的真实。同时,它还能捕捉人与人之间微妙的影响链条,最终构建出一个充满生命力的数字孪生社会。

惊人的预测能力:三个真实世界模拟的震撼结果

单看整套系统的设计,SocioVerse 基本上将人作为社会分子所受的核心影响因素进行了深入拆解,拆解细致到了如同深入毛孔一般。

因此,SocioVerse 具备了较为准确地预测真实世界行为的能力。

他们一共进行了三组实验,都相当准确。

图片

第一组是关于美国总统选举的预测。研究团队构建了一个模型,该模型包含 33 万多个虚拟选民。每个虚拟选民都具备 12 个关键的人口统计特征。他们运用迭代比例拟合技术,让这些虚拟选民的分布与美国各州的真实人口分布保持一致。接着,他们设计了一份详尽的调查问卷,问卷中有 49 个问题,涵盖从社会安全到 LGBTQ+权利等各种政治议题。

图片

使用 Qwen2.5 - 72b 模型后,系统在所有州的预测准确率为 92.2%,在关键摇摆州的准确率是 80%。依据美国“赢者通吃”的选举人票分配规则,这表明 AI 几乎能够完美地预测整个美国总统选举的结果。

第二组是突发新闻反馈分析。在这个场景里,研究者将 GPT 的发布当作目标事件,试着去预测公众对这一技术突破的反应。他们首先明确了潜在的受众群体,这个群体是对技术感兴趣的小红书用户。接着,从用户池中选取了 2 万个智能体。之后,依据 ABC 态度模型(包含情感、行为、认知)设计了一份问卷,这份问卷有 18 个问题,涵盖了公众认知、感知风险、感知收益、信任、公平和公众接受度这六个维度。

结果 AI 智能体的反应和实际用户的反应高度契合,就连在细微的观点分布方面也展现出极为相似的特性。GPT - 4o 模型模拟出的结果在 KL 散度指标上的得分仅有 0.196,这表明预测分布与真实分布几乎完全重合。

第三个实验是中国国家经济调查。这一模拟展现了系统在经济行为预测方面的能力。研究团队依据中国国家统计局的方法论,从用户池中选取了 1.6 万个智能体,这些智能体涵盖了全国 31 个地区。他们专门设计了一份经济问卷,询问关于食品、服装、住房、日用品、交通通讯、教育娱乐、医疗保健以及其他七大类消费的具体支出情况。

当把模拟结果和官方统计数据进行比较时,所有被测试的 AI 模型都显示出了极高的准确性,并且在发达地区的表现尤为突出。Llama3 - 70b 模型在所有消费类别上的均方根误差只有 0.026,这表明它几乎能够完全复制中国居民的消费模式。

图片

这三个实验表明,SocioVerse 已然成为了一个极为强大的系统,能够精准地模拟和预测大规模的社会现象。无论是新闻反应方面,还是政策影响方面,几乎所有的社会现象都无法超出它的模拟范畴。

并非虚拟小镇,而是虚拟现实

很多人会说这个逻辑与之前的斯坦福小镇没有什么差别呀。只是智能体的数量变大了,并且行为更多地集中在信息的交互方面了。

确实,在 SocioVerse 之前,这类 AI 智能体社会模拟项目已经存在过许多。2023 年末有“斯坦福小镇”虚拟社区,在这一试验中,25 个 AI 智能体在封闭环境中生活并相互互动。

上一个出圈的实验是 Project Sid ,他们将斯坦福小镇拓展到了 1000 人的规模,还把场景换成了 minecraft ,在那里智能体居民逐步形成了社区,也进行了选举。

但SocioVerse从本质上和这类实验完全不同。

斯坦福小镇与真实世界有一道清晰界限。它是一个完全封闭的虚构环境。所有角色都是人为创建的。没有任何真实人类数据的直接输入。它更像一个精心设计的互动小说,而非真实社会的镜像。

SocioVerse 与其他情况完全不一样。它是直接以 1000 万真实人类的行为数据为基础而建立的。每一个智能体都不是没有依据凭空想象出来的角色,而是依据真实用户的详细档案而形成的。

研究者声称采取了保护用户隐私的措施,比如只提取公开帖子内容且过滤异常数据。然而,这些措施无法改变一个基本事实,即 SocioVerse 正在从大规模真实人类行为中提取模式,并且用这些模式来预测更广泛群体的反应。它不是在想象的世界中试验,而是在创建一个与我们共同生活的社会世界的“数字孪生”。

这种特性直接与真实世界相对接,使得 SocioVerse 成为一种全新类型的社会工具。它是一个系统,不仅能够对社会进行观察和分析,还能够对社会进行预测,甚至有可能影响社会。这不再仅仅是学术上的思想实验,而是一种有可能对现实世界产生深远影响的技术。

AI将社交平台变成“数字牧羊人”

过去,平台拥有比较粗糙的用户数据,他们利用这些数据塑造了推荐算法,从而制造出达成平台利益最大化的信息茧房。现在,平台拥有一个能够非常准确地预测人类行为的系统,那有什么能阻止它从预测转向去影响群体的决策呢?

这种新型影响与传统的社会工程或宣传有所不同。它更为精细,能做到更加个性化,并且更加难以被察觉。它并非通过明显的不实信息来操作公众,而是巧妙地调整真实信息的呈现方式,将某些方面进行放大,同时把其他方面进行淡化,以此来产生预期的心理和行为反应。

这就是无声的控制,一根完美的牧羊杖。

平台借助 AI 获得的能力远超传统个性化推荐,进入了积极塑造集体行为和社会偏好的领域。信息茧房只是针对个人的最大注意力抽取技术,而 SocioVerse 会成为对全社会的指挥棒。平台能够随意指点,我们却只能在不知不觉中随之起舞。

这项研究依靠着拥有上亿用户的社交媒体,才有可能获取真实的用户数据。有了这套系统后,我们在平台上的意见和呼喊不再是需求本身,而只是系统捕捉到的、可利用来达成它个体目的的信息。

这是一种无可反击的意志,而世界上最强大的政客和民意操纵者正在实验室中诞生。

这可能是AI时代,我们所面对的最坏的可能。

附:论文链接

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275632.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息