Meta发布Llama 4系列开源AI模型，开启多模态AI新纪元-模具钢网

Meta 在今日凌晨发布了其旗下最新的 Llama 4 系列开源 AI 模型。这个系列包含了 Llama 4 Scout、Llama 4 Maverick 以及 Llama 4 Behemoth。

架构模型是什么意思_架构融合_

Meta 表示，这些模型接受了训练。训练所用的是大量未标注的文本、图像和视频数据。通过这种训练，这些模型具备了广泛的视觉理解能力。

今天开启了原生多模态人工智能创新的新纪元。我们推出了第一批 Llama 4 模型，分别是 Llama 4 Scout 和 Llama 4 Maverick。这两个模型是我们到目前为止最先进的，并且在多模态领域中是同类中最好的。

具体来看：

Llama 4 Scout

•170 亿活跃参数模型，配备 16 个专家。

•行业领先的上下文窗口，可处理 1000 万标记。

在多项被广泛认可的基准测试里，其表现比 Gemma 3 要好，比 Gemini 2.0 Flash-Lite 要好，也比 Mistral 3.1 要好。

Llama 4 Maverick

•170 亿活跃参数模型，配备 128 个专家。

在图像定位领域处于领先地位，能够使用户提示与相关视觉概念相契合，还能将模型响应固定在图像的特定区域。

在多项被广泛认可的基准测试里，其表现比 GPT-4o 要好，并且也优于 Gemini 2.0 Flash。

在推理方面，与 DeepSeek v3 取得了相当的结果；在编码方面，也与 DeepSeek v3 取得了相当的结果。同时，自身的活跃参数仅为 DeepSeek v3 的一半。

它的聊天版本在 LMArena 上的性价比方面，ELO 得分为 1417。

Meta 表示，这些模型成为其迄今最好的模型的原因是进行了从 Llama 4 Behemoth 中的知识蒸馏。Llama 4 Behemoth 是其迄今最强大的模型。Llama 4 Behemoth 正在进行训练。目前它正专注于 STEM 方面的基准测试。在该测试中，它的表现比 GPT-4.5 好。它的表现比 Claude Sonnet 3.7 好。它的表现比 Gemini 2.0 Pro 好。

这种架构在回答用户查询时效率也更高。

架构融合_架构模型是什么意思_

“混合专家架构”会把数据处理任务进行分解，将其拆分成子任务，接着把这些子任务委派给那些规模更小且专门的“专家”模型。

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：http://mjgaz.cn/fenxiang/275321.html

Meta发布Llama 4系列开源AI模型，开启多模态AI新纪元

相关推荐

联系我们