首个线性注意力架构的大模型来了，MiniMax 400 万超长上下文大模型重磅开源！

admin•2025-05-28 01:34:15•网站建设•阅读4

最近一个月，大模型领域热闹非凡，各大科技公司纷纷加码。阿里推出了 QwQ 模型，OpenAI 发布了 o1 Pro，Google 带来了 Gemini-2.0-Flash-Exp，而 DeepSeek 则凭借 V3 模型成功出圈。然而，也有

首个线性注意力架构的大模型来了，MiniMax 400 万超长上下文大模型重磅开源！

最近一个月，大模型领域热闹非凡，各大科技公司纷纷加码。阿里推出了 QwQ 模型，OpenAI 发布了 o1 Pro，Google 带来了 Gemini-2.0-Flash-Exp，而 DeepSeek 则凭借 V3 模型成功出圈。然而，也有零一万物卖身阿里，令人唏嘘。但令人欣喜的是，又一家国内大模型公司 MiniMax（也就是视频生成领域广为熟知的海螺）加入了战局。他们开源了两个重量级模型：