<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh">
	<id>https://arolstar52-zhtest.hf.space/index.php?action=history&amp;feed=atom&amp;title=Word2vec</id>
	<title>Word2vec - 版本历史</title>
	<link rel="self" type="application/atom+xml" href="https://arolstar52-zhtest.hf.space/index.php?action=history&amp;feed=atom&amp;title=Word2vec"/>
	<link rel="alternate" type="text/html" href="https://arolstar52-zhtest.hf.space/index.php?title=Word2vec&amp;action=history"/>
	<updated>2026-06-28T14:23:44Z</updated>
	<subtitle>在这个wiki上该页的修订历史</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://arolstar52-zhtest.hf.space/index.php?title=Word2vec&amp;diff=2682605&amp;oldid=prev</id>
		<title>imported&gt;Ohtashinichiro：​/* 参考文献 */</title>
		<link rel="alternate" type="text/html" href="https://arolstar52-zhtest.hf.space/index.php?title=Word2vec&amp;diff=2682605&amp;oldid=prev"/>
		<updated>2026-03-30T09:55:01Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;参考文献&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{RoughTranslation}}&lt;br /&gt;
{{机器学习导航栏}}&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Word2vec&amp;#039;&amp;#039;&amp;#039;是一群用來產生[[詞嵌入|詞向量]]的相關模型。這些模型為淺层雙層的[[神經網路]]，用來訓練以重新建構語言學之詞文本。網路以詞表現，並且需猜測相鄰位置的輸入詞，在word2vec中[[词袋模型]]假設下，詞的順序是不重要的。 &lt;br /&gt;
&lt;br /&gt;
訓練完成之後，word2vec模型可以把每個詞映射到一個向量，來表示詞与詞之間的關係。該向量為神經網路的隱藏層&amp;lt;ref name=&amp;quot;mikolov&amp;quot;&amp;gt;{{cite web|first=Tomas|last=Mikolov|title=Efficient Estimation of Word Representations in Vector Space|url=http://arxiv.org/pdf/1301.3781.pdf|accessdate=2015-08-14|display-authors=etal|archive-date=2022-05-09|archive-url=https://web.archive.org/web/20220509180219/https://arxiv.org/pdf/1301.3781.pdf}}&amp;lt;/ref&amp;gt;。&lt;br /&gt;
&lt;br /&gt;
Word2vec依賴skip-grams或[[詞袋模型|連續詞袋]]（CBOW）來建立神經詞嵌入。Word2vec為托馬斯·米科洛夫（Tomas Mikolov）在[[Google]]帶領的研究團隊創造。該演算法漸漸被其他人所分析和解釋&amp;lt;ref name=&amp;quot;explain&amp;quot;&amp;gt;{{cite web |first1=Yoav |last1=Goldberg |first2=Omar |last2=Levy |title=word2vec Explained: Deriving Mikolov et al.’s Negative-Sampling Word-Embedding Method |url=http://arxiv.org/pdf/1402.3722v1.pdf |accessdate=2015-08-14 |archive-date=2022-01-22 |archive-url=https://web.archive.org/web/20220122002315/http://arxiv.org/pdf/1402.3722v1.pdf }}&amp;lt;/ref&amp;gt;&amp;lt;ref name=&amp;quot;extensions&amp;quot;&amp;gt;{{cite AV media|first=Radim|last=Řehůřek|title=Word2vec and friends|medium=Youtube video|url=https://www.youtube.com/watch?v=wTp3P2UnTfQ|accessdate=2015-08-14|archive-date=2020-05-22|archive-url=https://web.archive.org/web/20200522072228/https://www.youtube.com/watch?v=wTp3P2UnTfQ&amp;amp;gl=US&amp;amp;hl=en}}&amp;lt;/ref&amp;gt;。&lt;br /&gt;
&lt;br /&gt;
==Skip-grams和CBOW ==&lt;br /&gt;
CBOW把一個詞從詞窗剔除。在CBOW下給定{{mvar|n}}詞圍繞著詞{{mvar|w}}，word2vec預測一個句子中其中一個缺漏的詞{{mvar|c}}，即以機率&amp;lt;math&amp;gt;p(c|w)&amp;lt;/math&amp;gt;來表示。相反地，Skip-gram給定詞窗中的文本，預測當前的詞&amp;lt;math&amp;gt;p(w|c)&amp;lt;/math&amp;gt;。&lt;br /&gt;
&lt;br /&gt;
==延伸==&lt;br /&gt;
Word2vec用來建構整份文件（而分獨立的詞）的延伸應用已被提出&amp;lt;ref name=&amp;quot;doc2vec&amp;quot;&amp;gt;{{cite web|first=Quoc|last=Le|title=Distributed Representations of Sentences and Documents.|url=http://arxiv.org/pdf/1405.4053v2.pdf|accessdate=2016-02-18|display-authors=etal|archive-date=2021-11-23|archive-url=https://web.archive.org/web/20211123033159/https://arxiv.org/pdf/1405.4053v2.pdf}}&amp;lt;/ref&amp;gt;，&lt;br /&gt;
該延伸稱為paragraph2vec或doc2vec，並且用C、Python&amp;lt;ref name=&amp;quot;doc2vec_python&amp;quot;&amp;gt;{{cite web|title=Doc2Vec tutorial using Gensim|url=https://medium.com/@klintcho/doc2vec-tutorial-using-gensim-ab3ac03d3a1|accessdate=2015-08-02|display-authors=etal|archive-date=2021-01-23|archive-url=https://web.archive.org/web/20210123122255/https://medium.com/@klintcho/doc2vec-tutorial-using-gensim-ab3ac03d3a1}}&amp;lt;/ref&amp;gt;&amp;lt;ref name=&amp;quot;doc2vec_imdb&amp;quot;&amp;gt;{{cite web|title=Doc2vec for IMDB sentiment analysis|url=https://github.com/piskvorky/gensim/blob/develop/docs/notebooks/doc2vec-IMDB.ipynb|accessdate=2016-02-18|display-authors=etal|archive-date=2020-01-07|archive-url=https://web.archive.org/web/20200107172512/https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-IMDB.ipynb|dead-url=no}}&amp;lt;/ref&amp;gt;和 Java/Scala&amp;lt;ref name=&amp;quot;doc2vec_java&amp;quot;&amp;gt;{{cite web|title=Doc2Vec and Paragraph Vectors for Classification|url=http://deeplearning4j.org/doc2vec.html|accessdate=2016-01-13|display-authors=etal|archive-url=https://web.archive.org/web/20151231073758/http://deeplearning4j.org/doc2vec.html|archive-date=2015-12-31|dead-url=yes}}&amp;lt;/ref&amp;gt;實做成工具（參考下方）。Java和Python也支援推斷文件嵌入於未觀測的文件。&lt;br /&gt;
&lt;br /&gt;
==分析==&lt;br /&gt;
對word2vec框架為何做[[词嵌入]]如此成功知之甚少，約阿夫·哥德堡（Yoav Goldberg）和歐莫·列維（Omer Levy）指出word2vec的功能導致相似文本擁有相似的嵌入（用[[余弦相似性]]計算）並且和[[約翰·魯伯特·弗斯]]的{{link-en|分佈語義|Distributional semantics|分佈假說}}有關。&lt;br /&gt;
&lt;br /&gt;
==實作==&lt;br /&gt;
* [https://code.google.com/p/word2vec/ C] {{Wayback|url=https://code.google.com/p/word2vec/ |date=20160310194120 }}&lt;br /&gt;
* [https://web.archive.org/web/20160305131924/http://deeplearning4j.org/word2vec.html Java/Scala]&lt;br /&gt;
* [https://github.com/tensorflow/tensorflow/blob/r1.1/tensorflow/examples/tutorials/word2vec/word2vec_basic.py Python] {{Wayback|url=https://github.com/tensorflow/tensorflow/blob/r1.1/tensorflow/examples/tutorials/word2vec/word2vec_basic.py |date=20200324104847 }}&lt;br /&gt;
* [http://radimrehurek.com/gensim/models/word2vec.html Python] {{Wayback|url=http://radimrehurek.com/gensim/models/word2vec.html |date=20201030161741 }}&lt;br /&gt;
&lt;br /&gt;
== 參見 ==&lt;br /&gt;
* [[向量空間模型]]&lt;br /&gt;
&lt;br /&gt;
== 参考文献 ==&lt;br /&gt;
{{Reflist|30em}}&lt;br /&gt;
&lt;br /&gt;
{{自然语言处理}}&lt;br /&gt;
{{Differentiable computing}}&lt;br /&gt;
&lt;br /&gt;
[[Category:自由科學軟件]]&lt;br /&gt;
[[Category:自然语言处理软件]]&lt;br /&gt;
[[Category:人工神经网络]]&lt;br /&gt;
[[Category:語義關係]]&lt;br /&gt;
[[Category:2013年软件]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Ohtashinichiro</name></author>
	</entry>
</feed>