首页
教程
IT编程
国外技术
登录
标签
高中生用「我的世界」评测SOTA模型!Claude暂时领先,De
高中生用「我的世界」评测SOTA模型!Claude暂时领先,DeepSeek紧随其后
新智元报道编辑:定慧【新智元导读】AI频频刷新基准测试纪录,却算不清「strawberry」里到底有几个字母r,在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起,例如由一名高中生开发的MC-Bench,用Minecraft方块
高中生用「我的世界」评测SOTA模型!Claude暂时领先,DeepSeek紧随其后
admin
7小时前
8
0