IBM Granite

维基百科,自由的百科全书
跳转到导航 跳转到搜索
IBM Granite
File:IBM granite 2 cubes logo.svg
IBM Granite的螢幕截圖
IBM Granite的螢幕截圖
開發者IBM Research[1]
首次发布2023年11月7日,​2年前​(2023-11-07
当前版本
    Module:EditAtWikidata第29行Lua错误:attempt to index field 'wikibase' (a nil value)
    源代码库
    • {{URL|example.com|可选的显示文本}}
    Module:EditAtWikidata第29行Lua错误:attempt to index field 'wikibase' (a nil value)
    引擎
      Module:EditAtWikidata第29行Lua错误:attempt to index field 'wikibase' (a nil value)
      平台IBM Watsonx (initially)
      GitHub
      Hugging Face
      RHEL AI
      类型
      许可协议权重:专有
      模型代码: 自由且开源 (Apache 2.0)[2]

      IBM Granite是由IBM於2024年發展的一系列解碼器單元AI基础模型[3]於2023年9月7日宣布[4][5],並在4天後發表了初步論文。[6]最初該計劃用於IBM基於雲端運算数据生成式人工智慧平台Watsonx,[7]IBM開源一些語言模型的原始碼。[8][9] Granite模型從網際網路學術出版物代碼数据集、法律和金融文件等資料組合來訓練。[10][11]

      基礎模型[编辑]

      基礎模型是指在大規模且多元資料上進行訓練的人工智慧模型,因此能夠適用於各種下游任務。 [12]

      Granite的第一批基礎模型分別為 Granite.13b.instruct 與 Granite.13b.chat。它們名稱中的「13b」取自模型擁有的130億個參數,低於當時大多數較大型語言模型的參數數量。後續模型的參數規模介於30億至340億之間。[4][13]

      2024 年5月6日,IBM依據Apache 2许可证釋出了四個版本的Granite程式碼模型源代码。該許可證為一個開放原始碼的寬鬆授權,允許使用者完全自由地使用、修改及分享軟體,IBM同時將這些模型上傳至Hugging Face平台供公眾使用。[14][15]

      根據IBM的報告,在參數規模相近的情況下,Granite 8b在多項與程式設計相關的任務上均超越了Llama 3的表現。[16][17]

      參見[编辑]

      參考資料[编辑]

      1. ^ McDowell, Steve. IBM's New Granite Foundation Models Enable Safe Enterprise AI. Forbes. 
      2. ^ ibm-granite/granite-code-models, IBM Granite, 2024-05-08 [2024-05-08] 
      3. ^ IBM Granite. IBM. 2024-06-24 (English). 
      4. ^ 4.0 4.1 Nirmal, Dinesh. Building AI for business: IBM's Granite foundation models. IBM. 2023-09-07 (English). 
      5. ^ IBM debuts Granite series of hardware-efficient language models. 2023-09-07 (English). 
      6. ^ Granite Foundation Models (PDF). IBM. 2023-11-30 (English). 
      7. ^ Fritts, Harold. IBM Adds Meta Llama 3 To watsonx, Expands AI Offerings. StorageReview.com. 2024-04-22 [2024-05-08] (en-US). 
      8. ^ Jindal, Siddharth. IBM Releases Open-Source Granite Code Models, Outperforms Llama 3. Analytics India Magazine. 2024-05-07 [2024-05-08] (en-US). 
      9. ^ Open sourcing IBM's Granite code models. 2021-02-09 (English). 
      10. ^ Azhar, Ali. IBM Patents a Faster Method to Train LLMs for Enterprises. Datanami. 2024-04-08 [2024-05-08] (English). 
      11. ^ Wiggers, Kyle. IBM rolls out new generative AI features and models. TechCrunch. 2023-09-07 [2024-05-08] (en-US). 
      12. ^ Introducing the Center for Research on Foundation Models (CRFM). Stanford HAI. 18 August 2021. 
      13. ^ Pawar, Sahil. IBM Introduces Granite Series LLM Models for Watsonx Platform. Analytics Drift. 2023-09-11 [2024-05-09] (en-US). 
      14. ^ Nine, Adrianna. IBM Makes Granite AI Models Open-Source Under New InstructLab Platform. ExtremeTech. 2024-05-07 (English). 
      15. ^ IBM open-sources its Granite AI models - and they mean business. ZDNET. [2024-05-21] (English). 
      16. ^ Jindal, Siddharth. IBM Releases Open-Source Granite Code Models, Outperforms Llama 3. Analytics India Magazine. 2024-05-07 [2024-05-09] (en-US). 
      17. ^ Synced. IBM's Granite Code: Powering Enterprise Software Development with AI Precision | Synced. syncedreview.com. 2024-05-13 [2024-05-21] (en-US). 

      外部鏈接[编辑]