1. 首页>>分享

Meta发布Llama 4系列开源AI模型,开启多模态AI新纪元

Meta 在今日凌晨发布了其旗下最新的 Llama 4 系列开源 AI 模型。这个系列包含了 Llama 4 Scout、Llama 4 Maverick 以及 Llama 4 Behemoth。

架构模型是什么意思_架构融合_

Meta 表示,这些模型接受了训练。训练所用的是大量未标注的文本、图像和视频数据。通过这种训练,这些模型具备了广泛的视觉理解能力。

今天开启了原生多模态人工智能创新的新纪元。我们推出了第一批 Llama 4 模型,分别是 Llama 4 Scout 和 Llama 4 Maverick。这两个模型是我们到目前为止最先进的,并且在多模态领域中是同类中最好的。

具体来看:

Llama 4 Scout

•170 亿活跃参数模型,配备 16 个专家。

•行业领先的上下文窗口,可处理 1000 万标记。

在多项被广泛认可的基准测试里,其表现比 Gemma 3 要好,比 Gemini 2.0 Flash-Lite 要好,也比 Mistral 3.1 要好。

Llama 4 Maverick

•170 亿活跃参数模型,配备 128 个专家。

在图像定位领域处于领先地位,能够使用户提示与相关视觉概念相契合,还能将模型响应固定在图像的特定区域。

在多项被广泛认可的基准测试里,其表现比 GPT-4o 要好,并且也优于 Gemini 2.0 Flash。

在推理方面,与 DeepSeek v3 取得了相当的结果;在编码方面,也与 DeepSeek v3 取得了相当的结果。同时,自身的活跃参数仅为 DeepSeek v3 的一半。

它的聊天版本在 LMArena 上的性价比方面,ELO 得分为 1417。

Meta 表示,这些模型成为其迄今最好的模型的原因是进行了从 Llama 4 Behemoth 中的知识蒸馏。Llama 4 Behemoth 是其迄今最强大的模型。Llama 4 Behemoth 正在进行训练。目前它正专注于 STEM 方面的基准测试。在该测试中,它的表现比 GPT-4.5 好。它的表现比 Claude Sonnet 3.7 好。它的表现比 Gemini 2.0 Pro 好。

这种架构在回答用户查询时效率也更高。

架构融合_架构模型是什么意思_

“混合专家架构”会把数据处理任务进行分解,将其拆分成子任务,接着把这些子任务委派给那些规模更小且专门的“专家”模型。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275321.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息