admin管理员组

文章数量:1130349

Grok

如今我们越来越明显地感受到,“Scaling Law 规模扩展”似乎走到了尽头。即使投入了庞大的算力资源,Grok-3 的性能也只略高于 GPT-4o,这让人不禁怀疑,单纯依赖堆叠算力的路径,是否仍是一条可持续的发展方向。

我们先来看具体的跑分表现。从整体成绩来看,Grok-3 是首个综合得分突破 1400 分的大模型,正式登顶当前评测榜单,也兑现了马斯克曾经的“豪言壮语”。

模型跑分细节表现

Grok

如今我们越来越明显地感受到,“Scaling Law 规模扩展”似乎走到了尽头。即使投入了庞大的算力资源,Grok-3 的性能也只略高于 GPT-4o,这让人不禁怀疑,单纯依赖堆叠算力的路径,是否仍是一条可持续的发展方向。

我们先来看具体的跑分表现。从整体成绩来看,Grok-3 是首个综合得分突破 1400 分的大模型,正式登顶当前评测榜单,也兑现了马斯克曾经的“豪言壮语”。

模型跑分细节表现

本文标签: Grok