維基數據

維基百科,自由的百科全書
(重新導向自Wikidata
跳至導覽 跳至搜尋
維基數據
Wikidata
File:Wikidata-logo-en.svg
File:Wikidata main page screenshot.png
維基數據首頁截圖
語言多語種
持有者維基媒體基金會
創始人維基媒體社群
網址{{URL|example.com|可选的显示文本}}Module:EditAtWikidata第29行Lua錯誤:attempt to index field 'wikibase' (a nil value)
商業性質
推出時間2012年10月30日,​13年前​(2012-10-30
內容許可
  • 主、屬性、詞位和EntitySchema命名空間的所有結構化數據使用CC 0協定;其他命名空間的文字內容使用CC BY-SA 4.0協定
  • 檔案均以列於其描述頁下的授權協定發佈

維基數據(英語:Wikidata)是一個可協同編輯的多語言知識圖譜,由維基媒體基金會寄存。[2]它是繼2006年的維基學院之後,第一個新的維基媒體基金會專案。[3]該專案通過軟件Wikibase執行,所有結構化數據以共享創意CC0協定作為開放數據發佈,可被維基媒體內外部專案使用。截至2025年初,維基數據擁有超過16.5億條專案聲明。[4]

維基數據與維基共享資源的工作方式類似,為其他維基計劃及各語種維基百科中的資訊框、列表及跨語言連結等提供統一存放的數據,該專案於2012年10月29日投入試執行,30日正式啟用。[5]

概念[編輯]

維基數據是一個文件導向的資料庫,重點圍繞「專案」(items)。每個專案都有一個唯一的持久識別碼,稱為QID——即大寫字母Q後接正整數,例如政治話題的QID為Q7163。這使得辨識專案不會偏袒任何語言翻譯所需的基本資訊。[6]

專案的標籤不必唯一(例如「Elvis Presley」可對應歌手和專輯兩個專案),但標籤與描述的組合必須唯一。專案的基本組成部分包括:識別碼(QID)、標籤、描述和別名,以及若干聲明及其屬性和值。

聲明[編輯]

聲明(statements)是維基數據記錄資訊的基本方式。形式上,它們採用鍵-值對,將屬性(如「作者」或「出版日期」)與一個或多個實體值(如「阿瑟·柯南·道爾」或「1902年」)配對。例如,非正式的中文陳述「牛奶是白色的」將編碼為:在「牛奶」專案下,將屬性「顏色」(P462)與值「白色」(Q23444)配對。[7]

聲明可以將一個屬性對映到多個值。例如,瑪麗·居里的「職業」屬性可以同時連結到「物理學家」和「化學家」兩個值,反映她從事兩種職業的事實。可選的「限定符」(qualifiers)可用於細化聲明的含義,例如「人口」聲明可加上「時間點:2011年」作為限定符。聲明的值還可以附上「參考文獻」(references),指向支援該聲明內容的來源。[8]

2013年2月4日,聲明功能正式引入維基數據。屬性的可能值最初限於兩種資料類型(專案與維基共享資源上的圖片),更多資料類型(如坐標和日期)隨後加入。第一個新增的類型「字串」於2013年3月6日部署。[9]

各語種維基百科訪問維基數據的功能在2013年3月27日至4月25日之間逐步部署。2015年9月16日,維基數據開始支援所謂「任意訪問」(arbitrary access),即從某一維基百科條目中讀取與之不直接關聯的維基數據專案的聲明。例如,在「柏林」條目中讀取關於德國維基數據專案的數據,這在以前是不可能的。[10]

屬性[編輯]

屬性(properties)的識別碼以大寫字母P開頭,後接正整數(如「顏色」為P462)。每個屬性在維基數據上都有自己的頁面,可包含標籤、描述、別名和聲明。屬性可定義關於其預期使用的「約束」(constraints),例如「首都」(P36)屬性包含「單值約束」,反映一個領土通常只有一個首都的事實。約束被視為測試提醒和提示,而非不可違反的規則。[11]新屬性的建立需要經過社群討論程式。

詞位[編輯]

自2016年起,維基數據支援詞位(lexemes)數據,用於儲存詞典編纂資訊。詞位的識別碼以字母L開頭,可包含聲明、義項和詞形。詞位使維基數據能夠記錄詞語的用法、詞語與維基數據專案之間的關聯、詞語翻譯,並提供機器可讀的詞典數據。截至2020年,維基數據上的詞位已超過25萬,覆蓋超過668種語言。[12]

發展歷程[編輯]

該專案最早由德國維基媒體協會啟動,其初衷是為維基百科中的條目提供可呼叫的數據。[13]艾倫人工智能研究所、戈登與貝蒂·摩爾基金會和Google公司向該計劃提供了130萬歐元的資助。[13]

開發工作最初分為三個階段:

  1. 集中儲存跨語言連結;
  2. 為所有語言維基百科的資訊框提供數據;
  3. 利用維基數據中的數據建立及更新條目。

維基數據於2012年10月29日上線,最初僅支援語言連結的集中化。2013年1月14日,匈牙利語維基百科成為第一個啟用維基數據跨語言連結的語言版本。到2013年3月6日,所有維基百科均已接入維基數據。[14]2016年,Google宣佈關閉Freebase資料庫,將其數據遷移至維基數據。[15]

內容[編輯]

維基數據的內容合集包括人物傳記數據、醫學數據、數字人文學科數據以及通過WikiCite專案積累的學術文獻元數據。[16][17]維基數據還包含了從其他開放專案(如Freebase)匯入的數據集。據2020年的一項研究,維基數據上的大量條目是由互聯網機械人從其他資料庫批次匯入的,這有助於打破「數據孤島」的壁壘。[18]

查詢服務[編輯]

2015年9月,維基媒體基金會發佈了維基數據查詢服務(Wikidata Query Service),允許用戶對維基數據中的內容執行查詢。該服務使用SPARQL作為查詢語言,以Blazegraph作為圖資料庫。[19]2021年,德國維基媒體協會發佈了查詢構建器(Query Builder),提供基於表單的查詢介面,使用戶無需掌握SPARQL也能查詢數據。

2025年10月,維基數據嵌入專案(Wikidata Embedding Project)上線,提供基於向量的語意搜尋工具,支援自然語言查詢,並通過模型上下文協定(MCP)標準為AI系統提供數據訪問能力。該專案是德國維基媒體協會、Jina.AI和DataStax的合作成果。[20]

反響與應用[編輯]

2014年11月,維基數據因其「規模之大和內在的開放性」獲得Module:WikidataLink第216行Lua錯誤:attempt to index field 'wikibase' (a nil value)(ODI)頒發的開放數據出版獎。[21]2025年,維基數據被數字公共產品聯盟認定為「數字公共產品」。[22]

截至2018年底,維基數據的資訊已被用於58.4%的英語維基百科條目中。維基數據還被廣泛應用於外部工具和商業產品:蘋果Siri亞馬遜Alexa等虛擬助手均使用維基數據的結構化數據集。[23]

標誌[編輯]

標誌上的條形圖案為用摩斯電碼編碼的「WIKI」一詞。該標誌由Arun Ganesh設計,並根據社群的決策選定[24]

參考資料[編輯]

File:Wikidata's World.webm
維基數據宣傳片
  1. ^ Wikidata.org Site Info. Alexa Internet. [2018-07-31]. (原始內容存檔於2017-09-03). 
  2. ^ Roth, Matthew. The Wikipedia data revolution. Wikimedia Foundation. 2012-03-30 [2026-05-25]. (原始內容存檔於2012-08-14). 
  3. ^ Wikidata. (原始內容存檔於2012-10-29). 
  4. ^ Wikidata Data Model Statements. Grafana. [2026-05-25]. 
  5. ^ Pintscher, Lydia. wikidata.org is live (with some caveats). wikidata-l (郵寄清單). [2026-05-25]. (原始內容存檔於2014-06-17). 
  6. ^ Vrandečić, Denny; Pintscher, Lydia; Krötzsch, Markus. Wikidata: The Making of. Companion Proceedings of the ACM Web Conference 2023. 2023-04-30: 615–624. doi:10.1145/3543873.3585579 (English). 
  7. ^ Help:Statements – Wikidata. [2026-05-25]. (原始內容存檔於2019-03-25). 
  8. ^ Help:Sources – Wikidata. [2026-05-25]. (原始內容存檔於2019-04-17). 
  9. ^ Pintscher, Lydia. Wikidata/Status updates/2013 03 01. Wikimedia Meta-Wiki. [2026-05-25]. (原始內容存檔於2013-04-12). 
  10. ^ Pintscher, Lydia. You can have all the data!. Wikimedia Deutschland. 2013-03-27 [2026-05-25]. (原始內容存檔於2013-03-29). 
  11. ^ Help:Property constraints portal – Wikidata. [2026-05-25]. (原始內容存檔於2019-06-01). 
  12. ^ Nielsen, Finn. Lexemes in Wikidata: 2020 status. Proceedings of the 7th Workshop on Linked Data in Linguistics. 2020: 82–86 (English). 
  13. ^ 13.0 13.1 Perez, Sarah. Wikipedia's Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others. TechCrunch. 2012-03-30 [2026-05-25]. (原始內容存檔於2012-10-05). 
  14. ^ Pintscher, Lydia. First steps of Wikidata in the Hungarian Wikipedia. Wikimedia Deutschland. 2013-01-14 [2026-05-25]. (原始內容存檔於2015-12-14). 
  15. ^ Freebase. Google Plus. 2014-12-16. (原始內容存檔於2019-03-20). 
  16. ^ Chisholm, Andrew; et al. Learning to generate one-sentence biographies from Wikidata. Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics. 2017: 633–642. arXiv:1702.06235可免費查閱 (English). 
  17. ^ Turki, Houcemeddine; et al. Wikidata: A large-scale collaborative ontological medical database. Journal of Biomedical Informatics. 2019, 99. doi:10.1016/j.jbi.2019.103292 (English). 
  18. ^ Module:Cite_Q第13行Lua錯誤:attempt to index field 'wikibase' (a nil value)
  19. ^ Wikidata Query Service. [2026-05-25]. (原始內容存檔於2016-11-07). 
  20. ^ Brandom, Russell. New project makes Wikipedia data more accessible to AI. TechCrunch. 2025-10-01 [2026-05-25] (English). 
  21. ^ First ODI Open Data Awards presented by Sirs Tim Berners-Lee and Nigel Shadbolt. (原始內容存檔於2016-03-24). 
  22. ^ Wikidata. Digital Public Goods. [2026-05-25] (English). 
  23. ^ Simonite, Tom. Inside the Alexa-Friendly World of Wikidata. Wired. 2019-02-18. ISSN 1059-1028 (English). 
  24. ^ Pintscher, Lydia. Und der Gewinner ist.... wikimedia.de. 德國維基媒體協會. 2012 [2020-09-09]. (原始內容存檔於2021-01-21). 

外部連結[編輯]

  • Module:Official_website第90行Lua錯誤:attempt to index field 'wikibase' (a nil value)

Module:Authority_control第183行Lua錯誤:attempt to index field 'wikibase' (a nil value)