GPT-2

生成型预训练变换模型 2
Generative Pre-trained Transformer 2（GPT-2）
	GPT-2 使用 Hugging Face Write With Transformer 网站完成的文本，提示文字来自维基百科（初始提示后所有突出显示的文本都是从第一个建议的完成机器生成的，没有进一步编辑） GPT-2 使用 Hugging Face Write With Transformer 网站完成的文本，提示文字来自维基百科（初始提示后所有突出显示的文本都是从第一个建议的完成机器生成的，没有进一步编辑）
原作者	OpenAI
首次发布	2019年2月14日，7年前
当前版本	Module:EditAtWikidata第29行Lua错误：attempt to index field 'wikibase' (a nil value)
源代码库	https://github.com/openai/gpt-2
引擎	Module:EditAtWikidata第29行Lua错误：attempt to index field 'wikibase' (a nil value)
前任	GPT-1
继任	GPT-3
类型	大型语言模型; 基于转换器的生成式预训练模型;
许可协议	Module:EditAtWikidata第29行Lua错误：attempt to index field 'wikibase' (a nil value)
网站	openai.com/blog/gpt-2-1-5b-release/

生成式预训练变换模型2（英语：Generative Pre-trained Transformer 2，简称 GPT-2）是OpenAI于2019年2月创建的开源人工智能。^[1]^[2]^[3]^[4]GPT-2能够翻译文本、回答问题、总结段落，^[5]并生成文本输出。虽然其输出内容有时与人类相似，^[6]但在生成长段落时输出内容可能会变得重复或无意义。^[7]GPT-2 是一个通用学习器，没有经过专门训练来执行任何特定的任务，^[5]^[8]并且是作为 OpenAI 2018 GPT 模型的“直接扩展”而创建的，^[9]其参数数量和训练数据集的大小均增加了十倍。^[4]

参考资料[编辑]

^ Piper, Kelsey. A poetry-writing AI has just been unveiled. It's ... pretty good.. Vox. 15 May 2019 [19 December 2020]. （原始内容存档于7 November 2020）.
^ Johnson, Khari. OpenAI releases curtailed version of GPT-2 language model. VentureBeat. 20 August 2019 [19 December 2020]. （原始内容存档于18 December 2020）.
^ Vincent, James. OpenAI has published the text-generating AI it said was too dangerous to share. The Verge. 7 November 2019 [19 December 2020]. （原始内容存档于11 June 2020）.
^ ^4.0 ^4.1 Better Language Models and Their Implications. OpenAI. 14 February 2019 [19 December 2020]. （原始内容存档于19 December 2020）.
^ ^5.0 ^5.1 Hegde. Unsupervised Paraphrase Generation using Pre-trained Language Models. arXiv:2006.05477 可免费查阅.
^ Kaiser, Caleb. Too big to deploy: How GPT-2 is breaking servers. Towards Data Science. 31 January 2020 [27 February 2021]. （原始内容存档于15 February 2020）.
^ Hern, Alex. New AI fake text generator may be too dangerous to release, say creators. The Guardian. 14 February 2019 [19 December 2020]. （原始内容存档于14 February 2019）.
^ Radford, Alec; Wu, Jeffrey; Child, Rewon; Luan, David; Amodei, Dario; Sutskever, Ilua. Language models are unsupervised multitask learners (PDF) 1 (8). 14 February 2019 [19 December 2020]. （原始内容存档 (PDF)于6 February 2021）.
^ Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya. Improving Language Understanding by Generative Pre-Training (PDF). OpenAI: 12. 11 June 2018 [23 January 2021]. （原始内容存档 (PDF)于26 January 2021）.

[voxxy2-1] Piper, Kelsey. A poetry-writing AI has just been unveiled. It's ... pretty good.. Vox. 15 May 2019 [19 December 2020]. （原始内容存档于7 November 2020）.

[vb-2] Johnson, Khari. OpenAI releases curtailed version of GPT-2 language model. VentureBeat. 20 August 2019 [19 December 2020]. （原始内容存档于18 December 2020）.

[verge2-3] Vincent, James. OpenAI has published the text-generating AI it said was too dangerous to share. The Verge. 7 November 2019 [19 December 2020]. （原始内容存档于11 June 2020）.

[openai-4] 4.0 ^4.1 Better Language Models and Their Implications. OpenAI. 14 February 2019 [19 December 2020]. （原始内容存档于19 December 2020）.

[badpaper-5] 5.0 ^5.1 Hegde. Unsupervised Paraphrase Generation using Pre-trained Language Models. arXiv:2006.05477 可免费查阅.

[tds2-6] Kaiser, Caleb. Too big to deploy: How GPT-2 is breaking servers. Towards Data Science. 31 January 2020 [27 February 2021]. （原始内容存档于15 February 2020）.

[guardian-7] Hern, Alex. New AI fake text generator may be too dangerous to release, say creators. The Guardian. 14 February 2019 [19 December 2020]. （原始内容存档于14 February 2019）.

[gpt2paper-8] Radford, Alec; Wu, Jeffrey; Child, Rewon; Luan, David; Amodei, Dario; Sutskever, Ilua. Language models are unsupervised multitask learners (PDF) 1 (8). 14 February 2019 [19 December 2020]. （原始内容存档 (PDF)于6 February 2021）.

[gpt1paper-9] Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya. Improving Language Understanding by Generative Pre-Training (PDF). OpenAI: 12. 11 June 2018 [23 January 2021]. （原始内容存档 (PDF)于26 January 2021）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

查论编可微分计算
概论	可微分编程自动微分张量微积分信息几何统计流形神经形态工程（英语：Neuromorphic engineering）模式识别运算学习理论（英语：Computational learning theory）归纳偏置
概念	梯度下降 SGD（英语：Stochastic gradient descent）聚类回归过拟合注意力卷积损失函数反向传播激活函数 softmax sigmoid ReLU 正则化数据集扩散（英语：Diffusion process）自回归
应用	机器学习人工神经网络深度学习科学计算人工智能语言模型大型语言模型
硬件	TPU VPU IPU（英语：Graphcore）忆阻器 SpiNNaker（英语：SpiNNaker）
软件库	Theano TensorFlow Keras PyTorch Caffe JAX MindSpore（英语：MindSpore） Flux.jl（英语：Flux (machine-learning framework)）
File:Symbol portal class.svg 主题计算机编程技术 File:Symbol category class.svg 分类人工神经网络机器学习

GPT-2

参考资料[编辑]

导航菜单

搜索