美团发布LongCat-Flash-Omni:开启全模态实时交互时代
美团发布LongCat-Flash-Omni:开启全模态实时交互时代
  • 2026-04-12 08:01:52
    来源:不动声色网

    美团发布LongCat-Flash-Omni:开启全模态实时交互时代

    字体:

    据美团官微消息,11月3日,美团LongCat-Flash系列再升级,正式发布全新家族成员——LongCat-Flash-Omni。

    自9月1日,美团正式发布LongCat-Flash系列模型,现已开源LongCat-Flash-Chat和LongCat-Flash-Thinking两大版本。

    据介绍,LongCat-Flash-Omni是一款开源全模态模型,在一体化框架中整合了离线多模态理解与实时音视频交互能力。LongCat-Flash-Omni以LongCat-Flash系列的高效架构设计为基础(Shortcut-Connected MoE,含零计算专家),同时创新性集成了高效多模态感知模块与语音重建模块。即便在总参数5600亿(激活参数270亿)的庞大参数规模下,仍实现了低延迟的实时音视频交互能力,为开发者的多模态应用场景提供了更高效的技术选择。

    综合评估结果表明,LongCat-Flash-Omni在全模态基准测试中达到开源最先进水平(SOTA),同时在文本、图像、视频理解及语音感知与生成等关键单模态任务中,均展现出极强的竞争力。LongCat-Flash-Omni是业界首个实现 “全模态覆盖、端到端架构、大参数量高效推理” 于一体的开源大语言模型,首次在开源范畴内实现了全模态能力对闭源模型的对标,并凭借创新的架构设计与工程优化,让大参数模型在多模态任务中也能实现毫秒级响应,解决了行业内推理延迟的痛点。

    【纠错】【责任编辑:铁血硬汉1】