相关内容

相关内容

大型语言模型在数学推理测试中集体翻车，FrontierMath 基准测试揭示真相

大型语言模型（LLM）最近在各种数学benchmark上疯狂刷分，动辄90%以上的正确率，搞得好像要统治数学界一样。然而，Epoch AI看不下去了，联手60多位顶尖数学家

2024-11-17 80

联系我们

在线咨询：

微信号：13588888888

工作日：9:30-18:30，节假日休息