返回资讯列表
模型发布

MiniMax发布M3模型:稀疏注意力架构实现15.6倍长上下文加速

来源:VentureBeat

中国AI初创公司MiniMax于6月1日正式发布新一代通用模型M3,采用全新研发的稀疏注意力架构,数据处理速度较前代提升5倍,长上下文响应速度提升15.6倍。该模型专为长时间复杂编码任务设计,推理成本大幅降低。据Bloomberg报道,MiniMax年化收入在过去两个月内翻倍至至少3亿美元。

阅读原文

https://venturebeat.com/technology/minimax-teases-upcoming-m3-model-with-new-sparse-attention-mechanism-and-15-6x-response-speed-boost

#MiniMax#M3#稀疏注意力#长上下文#中国AI

评论

0
登录 后参与评论