369IT编程
  •  首页
  •  教程
  •  IT编程
  •  国外技术
  •  登录
  1. 标签
  2. 首个线性注意力架构的大模型来了,MiniMax 400 万超长上
  • 首个线性注意力架构的大模型来了,MiniMax 400 万超长上下文大模型重磅开源!

    最近一个月,大模型领域热闹非凡,各大科技公司纷纷加码。阿里推出了 QwQ 模型,OpenAI 发布了 o1 Pro,Google 带来了 Gemini-2.0-Flash-Exp,而 DeepSeek 则凭借 V3 模型成功出圈。然而,也有
    首个线性注意力架构的大模型来了,MiniMax 400 万超长上下文大模型重磅开源!
    admin1天前
    80
CopyRight © 2022 All Rights Reserved
Processed: 0.015, SQL: 9