LongCat

維基百科,自由的百科全書
跳至導覽 跳至搜尋
LongCat
開發者美團
首次發佈LongCat-Flash-Chat
2025年9月1日,​9個月前​(2025-09-01
目前版本LongCat-Next
2026年4月2日,​2個月前​(2026-04-02
原始碼庫
  • {{URL|example.com|可选的显示文本}}
Module:EditAtWikidata第29行Lua錯誤:attempt to index field 'wikibase' (a nil value)
引擎
    Module:EditAtWikidata第29行Lua錯誤:attempt to index field 'wikibase' (a nil value)
    類型LLM
    GPT
    LxM
    許可協定MIT(部分模型)
    網站longcat.ai

    LongCat是由中國互聯網公司美團開發的大型語言模型系列[1],涵蓋語言、多模態、圖像生成、影片生成與語音互動等多類模型,其最新版本為LongCat-Next(2026年4月)。

    概述[編輯]

    LongCat是由美團旗下LongCat團隊開發的基於轉換器的生成式預訓練模型Generative pre-trained transformer,GPT)系列,專注於智能體(Agentic)任務場景下的實用性與推理效率。[2]

    LongCat系列模型大多以MIT許可證開源發佈,可在GitHub及Hugging Face平台取得,同時通過官網longcat.ai向公眾提供線上對話體驗。

    版本歷史[編輯]

    版本 類型 發佈日期 狀態
    LongCat-Flash-Chat 語言大模型(MoE,560B參數) 2025年9月1日 活躍
    LongCat-Flash-Thinking 推理模型 2025年12月 活躍
    LongCat-Flash-Thinking-2601 推理增強語言模型(升級版) 2026年1月15日 活躍
    LongCat-Flash-Omni 全模態語言模型 2026年3月 活躍
    LongCat-Video 影片生成模型(13.6B參數) 2025年9月 活躍
    LongCat-Image 圖像生成模型(6B參數) 2025年 活躍
    LongCat-Audio-Codec 語音編解碼模型 2025年 活躍
    LongCat-Flash-Prover 數學定理證明模型 2026年4月 活躍
    LongCat-Next 原生多模態模型 2026年4月2日 活躍

    LongCat-Flash-Chat[編輯]

    2025年9月1日,美團正式發佈並開源LongCat-Flash-Chat。[3]該模型採用混合專家模型(Mixture-of-Experts,MoE)架構,總參數量為560B,每個Token依據上下文需求僅啟用18.6B至31.3B參數(平均約27B)。模型在H800上的推理速度達到100+ tokens/s,API輸出成本為5元/百萬Token,以MIT許可證開源。[4]

    在基準測試方面,LongCat-Flash-Chat在ArenaHard-V2中得分86.50,在MMLU中得分89.71,在CEval中得分90.44。在智能體工具使用測試τ2-Bench中的成績超越參數規模更大的模型,並在VitaBench複雜場景評測中以24.30分排名第一。在指令遵循評測IFEval中得分89.65,排名第一;中文指令遵循基準COLLIE得分57.10,Meeseeks-zh得分43.03。[5]

    架構特性[編輯]

    LongCat-Flash引入「零計算專家(Zero-Computation Experts)」機制,對於上下文中較簡單的Token可跳過大部分計算,僅在需要時呼叫更多參數,從而實現算力按需分配。此外,該模型在層間鋪設跨層通道,使MoE的通訊與計算能夠大程度上並列,極大提升訓練與推理效率。訓練過程採用超參遷移與模型層疊加方式,整體訓練在30天內完成。[6]

    LongCat-Flash-Thinking 系列[編輯]

    LongCat-Flash-Thinking是在LongCat-Flash基礎上強化推理能力的版本,主要面向需要多步規劃與邏輯推理的複雜任務場景。

    2026年1月15日,升級版LongCat-Flash-Thinking-2601正式發佈並開源。該版本創新性地引入「重思考模式」,通過並列推理(同時探索多條推理路徑)與深度總結(對多路徑結果進行整合最佳化)兩階段設計,提升複雜任務中的表現。根據官方資料,LongCat-Flash-Thinking-2601在Agentic Search、Agentic Tool Use與TIR等核心評測基準上均達到開源模型SOTA水平。[7]

    LongCat-Flash-Omni[編輯]

    LongCat-Flash-Omni是LongCat-Flash系列的全模態版本,支援文字、圖像、影片理解,以及語音感知與生成等多類任務,採用端到端架構設計。[8]

    LongCat-Video[編輯]

    LongCat-Video是美團LongCat團隊發佈的影片生成模型,參數量為13.6B,基於擴散Transformer(Diffusion Transformer,DiT)架構構建,以MIT許可證開源。[9]

    該模型以統一框架同時支援文字生成影片(T2V)、圖像生成影片(I2V)與影片續寫三類任務,所有任務均在同一Transformer骨幹內處理。在長影片生成方面,LongCat-Video採用粗到精(coarse-to-fine)兩階段流程:首先以480p、15fps生成粗版影片,再通過基於LoRA的「精修專家」升至720p、30fps輸出,該流程可在單張H800 GPU上數分鐘內完成生成。此外,模型採用稀疏塊注意力(Block Sparse Attention,BSA)替代密集注意力,以降低長影片生成的計算開銷。[10]

    LongCat-Image[編輯]

    LongCat-Image是美團LongCat團隊發佈的圖像生成模型,參數量為6B,以MIT許可證開源,支援文字生圖與圖像編輯。[11]

    LongCat-Audio-Codec[編輯]

    LongCat-Audio-Codec是美團LongCat團隊發佈的專用語音編解碼方案,提供一套Token生成器與Token還原器工具鏈,將原始音頻訊號對映為語意與聲學並列的Token序列,並通過解碼模組重構高質素音頻,為語音大模型提供全鏈路音頻處理支援。[12]

    LongCat-Flash-Prover[編輯]

    LongCat-Flash-Prover是面向數學形式化與定理證明的專用開源模型,支援自動形式化(Auto-Formalization)、草圖生成(Sketching)與證明(Proving)三項原子能力,並基於Lean4形式語言對輸出進行機器可驗證。根據官方技術資料,該模型結合工具整合推理(Tool-Integrated Reasoning,TIR),在MiniF2F-Test上僅用72次推理嘗試即達到97.1%的通過率;在MathOlympiad-Bench上得分46.7%,在PutnamBench上得分41.5%。[13]

    LongCat-Next[編輯]

    2026年4月2日,美團LongCat團隊發佈並開源LongCat-Next,這是一個原生離散多模態模型,將圖像、音頻與文字統一對映為同源的離散Token,並通過單一自回歸骨幹以純粹的下一個Token預測(Next Token Prediction,NTP)範式統一建模各類模態。[14]

    LongCat-Next以LongCat-Flash-Lite MoE(總參數68.5B,啟用參數3B)為基座,在DiNA框架下訓練,並採用dNaViT分詞器進行任意解像度視覺分詞。理解與生成在同一Token空間內被統一為同一數學問題,以相同自回歸目標訓練。[15]

    參見[編輯]

    參考來源[編輯]

    1. ^ LongCat AI by Meituan. www.longcatai.org. [2026-05-06] (English). 
    2. ^ 美团正式发布并开源 LongCat-Flash-Chat. tech.meituan.com. [2026-05-06] (中文). 
    3. ^ 美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代. tech.meituan.com. [2026-05-06] (中文). 
    4. ^ 美团正式发布并开源 LongCat-Flash-Chat. www.meituan.com. [2026-05-06] (中文). 
    5. ^ 美团正式发布并开源 LongCat-Flash-Chat. tech.meituan.com. [2026-05-06] (中文). 
    6. ^ 美团正式发布并开源 LongCat-Flash-Chat. tech.meituan.com. [2026-05-06] (中文). 
    7. ^ LongCat-Flash-Thinking-2601. tech.meituan.com. [2026-05-06] (中文). 
    8. ^ Longcat - 美团技术团队. tech.meituan.com. [2026-05-06] (中文). 
    9. ^ Meituan's LongCat Video. crepal.ai. [2026-05-06] (English). 
    10. ^ LongCat-Video: Generate 1 minute long AI videos with this model. medium.com. [2026-05-06] (English). 
    11. ^ Longcat - 美团技术团队. tech.meituan.com. [2026-05-06] (中文). 
    12. ^ Longcat - 美团技术团队. tech.meituan.com. [2026-05-06] (中文). 
    13. ^ LongCat AI - LongCat-Next and Open Multimodal Models. www.longcatai.org. [2026-05-06] (English). 
    14. ^ 美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语. tech.meituan.com. [2026-05-06] (中文). 
    15. ^ 美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语. tech.meituan.com. [2026-05-06] (中文).