3 月 10 日消息,IT 之家称,据路透社报道,鸿海在今日宣布推出首个大语言模型“FoxBrain”,同时计划运用此技术来对制造和供应链管理进行优化。
鸿海在声明里称,FoxBrain 是通过 120 块英伟达 H100 GPU 完成训练的。其训练周期大概为四周。目前,鸿海既是苹果 iPhone 的组装商,也是英伟达 AI 服务器的制造商,并且是全球最大的电子产品代工企业。
该模型是以 Meta 的 Llama 3.1 架构为基础的,并且经过了专门的优化,目的是适配繁体中文以及本土的语言风格。鸿海宣称,这是当地首个拥有推理能力的大型语言模型。它还宣称,虽然 FoxBrain 在性能方面比 DeepSeek 的蒸馏模型稍微逊色一些,但是整体表现已经接近全球顶尖的水准。
FoxBrain 主要是用于内部的场景。它能够支持数据分析这一工作。它可以辅助决策。它还能进行文档协作。它具备数学运算的能力。它可以用于推理与解决问题。它也能够生成代码。
鸿海打算与科技企业展开合作,以此来拓展该模型的应用范畴。并且,它还将开放部分源代码,目的是推动人工智能在制造领域、供应链管理领域以及智能决策领域的发展。
英伟达为 FoxBrain 训练提供了支持。它通过位于高雄的超算“Taipei - 1”来提供算力。同时,在训练过程中还提供了技术指导。
IT 之家指出:“Taipei - 1”乃是当地规模最为宏大的超级计算机,并且是由英伟达在高雄展开运营的。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274840.html