admin管理员组文章数量:1036097
首个线性注意力架构的大模型来了,MiniMax 400 万超长上下文大模型重磅开源!
最近一个月,大模型领域热闹非凡,各大科技公司纷纷加码。阿里推出了 QwQ 模型,OpenAI 发布了 o1 Pro,Google 带来了 Gemini-2.0-Flash-Exp,而 DeepSeek 则凭借 V3 模型成功出圈。然而,也有零一万物卖身阿里,令人唏嘘。但令人欣喜的是,又一家国内大模型公司 MiniMax(也就是视频生成领域广为熟知的海螺)加入了战局。他们开源了两个重量级模型:
- MiniMax-Text-01[1]:456B 参数的基础语言模型。
- MiniMax-VL-01[2]:视觉多模态模型。
MiniMax 的优势何在?它凭借什么在竞争中脱颖而出?我们先来看看它的主要特点:
首个线性注意力架构的大模型来了,MiniMax 400 万超长上下文大模型重磅开源!
最近一个月,大模型领域热闹非凡,各大科技公司纷纷加码。阿里推出了 QwQ 模型,OpenAI 发布了 o1 Pro,Google 带来了 Gemini-2.0-Flash-Exp,而 DeepSeek 则凭借 V3 模型成功出圈。然而,也有零一万物卖身阿里,令人唏嘘。但令人欣喜的是,又一家国内大模型公司 MiniMax(也就是视频生成领域广为熟知的海螺)加入了战局。他们开源了两个重量级模型:
- MiniMax-Text-01[1]:456B 参数的基础语言模型。
- MiniMax-VL-01[2]:视觉多模态模型。
MiniMax 的优势何在?它凭借什么在竞争中脱颖而出?我们先来看看它的主要特点:
本文标签: 首个线性注意力架构的大模型来了,MiniMax 400 万超长上下文大模型重磅开源!
版权声明:本文标题:首个线性注意力架构的大模型来了,MiniMax 400 万超长上下文大模型重磅开源! 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://it.en369.cn/jiaocheng/1748221051a2271354.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论