LongCat
| 開發者 | 美團 |
|---|---|
| 首次發佈 | LongCat-Flash-Chat 2025年9月1日 |
| 目前版本 | LongCat-Next 2026年4月2日 |
| 原始碼庫 |
|
| 引擎 | |
| 類型 | LLM GPT LxM |
| 許可協定 | MIT(部分模型) |
| 網站 | longcat |
LongCat是由中國互聯網公司美團開發的大型語言模型系列[1],涵蓋語言、多模態、圖像生成、影片生成與語音互動等多類模型,其最新版本為LongCat-Next(2026年4月)。
概述[編輯]
LongCat是由美團旗下LongCat團隊開發的基於轉換器的生成式預訓練模型(Generative pre-trained transformer,GPT)系列,專注於智能體(Agentic)任務場景下的實用性與推理效率。[2]
LongCat系列模型大多以MIT許可證開源發佈,可在GitHub及Hugging Face平台取得,同時通過官網longcat.ai向公眾提供線上對話體驗。
版本歷史[編輯]
| 版本 | 類型 | 發佈日期 | 狀態 |
|---|---|---|---|
| LongCat-Flash-Chat | 語言大模型(MoE,560B參數) | 2025年9月1日 | 活躍 |
| LongCat-Flash-Thinking | 推理模型 | 2025年12月 | 活躍 |
| LongCat-Flash-Thinking-2601 | 推理增強語言模型(升級版) | 2026年1月15日 | 活躍 |
| LongCat-Flash-Omni | 全模態語言模型 | 2026年3月 | 活躍 |
| LongCat-Video | 影片生成模型(13.6B參數) | 2025年9月 | 活躍 |
| LongCat-Image | 圖像生成模型(6B參數) | 2025年 | 活躍 |
| LongCat-Audio-Codec | 語音編解碼模型 | 2025年 | 活躍 |
| LongCat-Flash-Prover | 數學定理證明模型 | 2026年4月 | 活躍 |
| LongCat-Next | 原生多模態模型 | 2026年4月2日 | 活躍 |
LongCat-Flash-Chat[編輯]
2025年9月1日,美團正式發佈並開源LongCat-Flash-Chat。[3]該模型採用混合專家模型(Mixture-of-Experts,MoE)架構,總參數量為560B,每個Token依據上下文需求僅啟用18.6B至31.3B參數(平均約27B)。模型在H800上的推理速度達到100+ tokens/s,API輸出成本為5元/百萬Token,以MIT許可證開源。[4]
在基準測試方面,LongCat-Flash-Chat在ArenaHard-V2中得分86.50,在MMLU中得分89.71,在CEval中得分90.44。在智能體工具使用測試τ2-Bench中的成績超越參數規模更大的模型,並在VitaBench複雜場景評測中以24.30分排名第一。在指令遵循評測IFEval中得分89.65,排名第一;中文指令遵循基準COLLIE得分57.10,Meeseeks-zh得分43.03。[5]
架構特性[編輯]
LongCat-Flash引入「零計算專家(Zero-Computation Experts)」機制,對於上下文中較簡單的Token可跳過大部分計算,僅在需要時呼叫更多參數,從而實現算力按需分配。此外,該模型在層間鋪設跨層通道,使MoE的通訊與計算能夠大程度上並列,極大提升訓練與推理效率。訓練過程採用超參遷移與模型層疊加方式,整體訓練在30天內完成。[6]
LongCat-Flash-Thinking 系列[編輯]
LongCat-Flash-Thinking是在LongCat-Flash基礎上強化推理能力的版本,主要面向需要多步規劃與邏輯推理的複雜任務場景。
2026年1月15日,升級版LongCat-Flash-Thinking-2601正式發佈並開源。該版本創新性地引入「重思考模式」,通過並列推理(同時探索多條推理路徑)與深度總結(對多路徑結果進行整合最佳化)兩階段設計,提升複雜任務中的表現。根據官方資料,LongCat-Flash-Thinking-2601在Agentic Search、Agentic Tool Use與TIR等核心評測基準上均達到開源模型SOTA水平。[7]
LongCat-Flash-Omni[編輯]
LongCat-Flash-Omni是LongCat-Flash系列的全模態版本,支援文字、圖像、影片理解,以及語音感知與生成等多類任務,採用端到端架構設計。[8]
LongCat-Video[編輯]
LongCat-Video是美團LongCat團隊發佈的影片生成模型,參數量為13.6B,基於擴散Transformer(Diffusion Transformer,DiT)架構構建,以MIT許可證開源。[9]
該模型以統一框架同時支援文字生成影片(T2V)、圖像生成影片(I2V)與影片續寫三類任務,所有任務均在同一Transformer骨幹內處理。在長影片生成方面,LongCat-Video採用粗到精(coarse-to-fine)兩階段流程:首先以480p、15fps生成粗版影片,再通過基於LoRA的「精修專家」升至720p、30fps輸出,該流程可在單張H800 GPU上數分鐘內完成生成。此外,模型採用稀疏塊注意力(Block Sparse Attention,BSA)替代密集注意力,以降低長影片生成的計算開銷。[10]
LongCat-Image[編輯]
LongCat-Image是美團LongCat團隊發佈的圖像生成模型,參數量為6B,以MIT許可證開源,支援文字生圖與圖像編輯。[11]
LongCat-Audio-Codec[編輯]
LongCat-Audio-Codec是美團LongCat團隊發佈的專用語音編解碼方案,提供一套Token生成器與Token還原器工具鏈,將原始音頻訊號對映為語意與聲學並列的Token序列,並通過解碼模組重構高質素音頻,為語音大模型提供全鏈路音頻處理支援。[12]
LongCat-Flash-Prover[編輯]
LongCat-Flash-Prover是面向數學形式化與定理證明的專用開源模型,支援自動形式化(Auto-Formalization)、草圖生成(Sketching)與證明(Proving)三項原子能力,並基於Lean4形式語言對輸出進行機器可驗證。根據官方技術資料,該模型結合工具整合推理(Tool-Integrated Reasoning,TIR),在MiniF2F-Test上僅用72次推理嘗試即達到97.1%的通過率;在MathOlympiad-Bench上得分46.7%,在PutnamBench上得分41.5%。[13]
LongCat-Next[編輯]
2026年4月2日,美團LongCat團隊發佈並開源LongCat-Next,這是一個原生離散多模態模型,將圖像、音頻與文字統一對映為同源的離散Token,並通過單一自回歸骨幹以純粹的下一個Token預測(Next Token Prediction,NTP)範式統一建模各類模態。[14]
LongCat-Next以LongCat-Flash-Lite MoE(總參數68.5B,啟用參數3B)為基座,在DiNA框架下訓練,並採用dNaViT分詞器進行任意解像度視覺分詞。理解與生成在同一Token空間內被統一為同一數學問題,以相同自回歸目標訓練。[15]
參見[編輯]
參考來源[編輯]
- ^ LongCat AI by Meituan. www.longcatai.org. [2026-05-06] (English).
- ^ 美团正式发布并开源 LongCat-Flash-Chat. tech.meituan.com. [2026-05-06] (中文).
- ^ 美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代. tech.meituan.com. [2026-05-06] (中文).
- ^ 美团正式发布并开源 LongCat-Flash-Chat. www.meituan.com. [2026-05-06] (中文).
- ^ 美团正式发布并开源 LongCat-Flash-Chat. tech.meituan.com. [2026-05-06] (中文).
- ^ 美团正式发布并开源 LongCat-Flash-Chat. tech.meituan.com. [2026-05-06] (中文).
- ^ LongCat-Flash-Thinking-2601. tech.meituan.com. [2026-05-06] (中文).
- ^ Longcat - 美团技术团队. tech.meituan.com. [2026-05-06] (中文).
- ^ Meituan's LongCat Video. crepal.ai. [2026-05-06] (English).
- ^ LongCat-Video: Generate 1 minute long AI videos with this model. medium.com. [2026-05-06] (English).
- ^ Longcat - 美团技术团队. tech.meituan.com. [2026-05-06] (中文).
- ^ Longcat - 美团技术团队. tech.meituan.com. [2026-05-06] (中文).
- ^ LongCat AI - LongCat-Next and Open Multimodal Models. www.longcatai.org. [2026-05-06] (English).
- ^ 美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语. tech.meituan.com. [2026-05-06] (中文).
- ^ 美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语. tech.meituan.com. [2026-05-06] (中文).