首页
教程
IT编程
国外技术
登录
标签
3710亿数学tokens,全面开放!史上最大高质量开源数学预训
3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布
在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710 亿(371B)tokens,覆盖网页、代码和高质量合成数据三
3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布
admin
14小时前
13
0