<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh">
	<id>https://arolstar52-zhtest.hf.space/index.php?action=history&amp;feed=atom&amp;title=OpenAI_Five</id>
	<title>OpenAI Five - 版本历史</title>
	<link rel="self" type="application/atom+xml" href="https://arolstar52-zhtest.hf.space/index.php?action=history&amp;feed=atom&amp;title=OpenAI_Five"/>
	<link rel="alternate" type="text/html" href="https://arolstar52-zhtest.hf.space/index.php?title=OpenAI_Five&amp;action=history"/>
	<updated>2026-07-01T01:07:17Z</updated>
	<subtitle>在这个wiki上该页的修订历史</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://arolstar52-zhtest.hf.space/index.php?title=OpenAI_Five&amp;diff=4596123&amp;oldid=prev</id>
		<title>imported&gt;Sakura286：​增加或调整内部链接: &quot;AlphaStar&quot;.</title>
		<link rel="alternate" type="text/html" href="https://arolstar52-zhtest.hf.space/index.php?title=OpenAI_Five&amp;diff=4596123&amp;oldid=prev"/>
		<updated>2026-01-08T10:27:01Z</updated>

		<summary type="html">&lt;p&gt;增加或调整内部链接: &amp;quot;AlphaStar&amp;quot;.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;OpenAI Five&amp;#039;&amp;#039;&amp;#039;是由[[OpenAI]]開發的[[電腦程式]]，專門用來遊玩5對5的[[电子游戏|電子遊戲]]《[[Dota 2]]》。該系統於2017年首次公開亮相，在一場現場一對一比賽中與職業玩家Dendi進行對戰，最終使其落敗。隔年，該系統已發展為完整的五人隊伍，開始與職業戰隊對抗，並展現出擊敗職業戰隊的能力。&lt;br /&gt;
&lt;br /&gt;
由於OpenAI選擇以《Dota 2》這款複雜遊戲作為[[机器学习|機器學習]]研究對象，該公司認為此舉能更精確地捕捉現實世界中存在的不確定性與連續性，從而構建出更具普遍性的問題解決系統。最終，OpenAI Five 採用的演算法及程式碼被該公司研發中的另一個[[神经回路|神經迴路]]借用，該神經網絡用以控制一隻實體機械手。OpenAI Five曾與其他類似人工智慧案例相比較，例如在電子遊戲《星際爭霸2》中與人類對戰的{{link-en|AlphaStar|AlphaStar (software)}}、在[[围棋|圍棋]]中與人類對弈的[[AlphaGo]] 、在[[國際象棋|西洋棋]]中與人類對弈的[[深藍 (超級電腦)|深藍]]以及在電視遊戲節目《[[危险边缘]]》中的[[沃森 (人工智能程序)|華生]] 。&lt;br /&gt;
&lt;br /&gt;
== 歷史 ==&lt;br /&gt;
自2016年11月起，OpenAI開始開發機器人所採用的演算法。由於《[[Dota 2]]》是一款在直播平台[[Twitch]]上廣受歡迎、具有原生[[Linux]]支援且提供[[应用程序接口|應用程式介面]]（API）。 &amp;lt;ref&amp;gt;{{Cite web |title=OpenAI Five |url=https://openai.com/five/#timeline |website=openai.com/five |last=OpenAI |url-status=live |archive-url=https://web.archive.org/web/20180901172612/https://openai.com/five/#timeline |archive-date=2018-09-01 |access-date=2018-10-10}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
在組成完整五人隊伍之前，該系統於2017年8月在年度冠軍賽[[2017年Dota 2國際邀請賽|2017年Dota2國際邀請賽]]中首次公開展示；在一場現場一對一比賽中，烏克蘭職業玩家 Dendi輸給了一個OpenAI機器人。&amp;lt;ref&amp;gt;{{Cite web |title=My favorite game has been invaded by killer AI bots and Elon Musk hype |url=https://www.theverge.com/2017/8/14/16141938/dota-2-openai-bots-elon-musk-artificial-intelligence |website=The Verge |date=2017-08-14 |last=Savov |first=Vlad |url-status=live |archive-url=https://web.archive.org/web/20180626030145/https://www.theverge.com/2017/8/14/16141938/dota-2-openai-bots-elon-musk-artificial-intelligence |archive-date=2018-06-26 |access-date=2018-06-25}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Cite web |title=OpenAI&amp;#039;s bot beats top Dota 2 player so badly that he quits |url=https://venturebeat.com/2017/08/11/openais-bot-beats-top-dota-2-player-so-badly-that-he-quits/ |website=Venture Beat |language=en |last=Frank |first=Blair Hanley |url-status=dead |archive-url=https://web.archive.org/web/20170812065202/https://venturebeat.com/2017/08/11/openais-bot-beats-top-dota-2-player-so-badly-that-he-quits/ |archive-date=2017-08-12 |access-date=2017-08-12}}&amp;lt;/ref&amp;gt;比賽結束後，首席技術官[[格雷格·布羅克曼]]解釋稱，該機器人經過兩週實時自我對戰後完成學習，而此學習軟體被視為邁向開發能處理複雜任務（例如外科手術）的軟體的一步。&amp;lt;ref&amp;gt;{{Cite web |title=Dota 2 |url=https://blog.openai.com/dota-2/ |website=blog.openai.com |date=2017-08-11 |language=en |last=OpenAI |url-status=live |archive-url=https://web.archive.org/web/20170811235617/https://blog.openai.com/dota-2/ |archive-date=2017-09-11 |access-date=2017-09-11}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Cite web |title=More on Dota 2 |url=https://blog.openai.com/more-on-dota-2/ |website=blog.openai.com |date=2017-08-16 |language=en |last=OpenAI |url-status=live |archive-url=https://web.archive.org/web/20170816161246/https://blog.openai.com/more-on-dota-2/ |archive-date=2017-08-16 |access-date=2017-08-16}}&amp;lt;/ref&amp;gt; &lt;br /&gt;
&lt;br /&gt;
[[强化学习|强化学習]]的的方法，使得這些機器人在數月內每日進行數百次自我對戰後逐步學習，並對擊殺敵人或摧毀防禦塔等行動給予獎勵。&amp;lt;ref name=&amp;quot;Simonite June 2018&amp;quot;&amp;gt;{{Cite magazine|last=Simonite|first=Tom|date=2018-06-25|title=Can Bots Outwit Humans in One of the Biggest Esports Games?|url=https://www.wired.com/story/can-bots-outwit-humans-in-one-of-the-biggest-esports-games/|magazine=Wired|archive-url=https://web.archive.org/web/20180625213810/https://www.wired.com/story/can-bots-outwit-humans-in-one-of-the-biggest-esports-games/|archive-date=2018-06-25|access-date=2018-06-25}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Cite news |author=Kahn |first=Jeremy |title=A Bot Backed by Elon Musk Has Made an AI Breakthrough in Video Game World |url=https://www.bloomberg.com/news/articles/2018-06-25/musk-backed-bot-conquers-e-gamer-teams-in-ai-breakthrough |work=Bloomberg.com |date=2018-06-25 |accessdate=2018-06-27 |archiveurl=https://web.archive.org/web/20180627144300/https://www.bloomberg.com/news/articles/2018-06-25/musk-backed-bot-conquers-e-gamer-teams-in-ai-breakthrough |archivedate=2018-06-27}}&amp;lt;/ref&amp;gt;&amp;lt;ref name=&amp;quot;Clifford June 2018&amp;quot;&amp;gt;{{Cite web |title=Bill Gates says gamer bots from Elon Musk-backed nonprofit are &amp;#039;huge milestone&amp;#039; in A.I. |url=https://www.cnbc.com/2018/06/27/bill-gates-openai-robots-beating-humans-at-dota-2-is-ai-milestone.html |website=CNBC |date=2018-06-28 |language=en |url-status=live |archive-url=https://web.archive.org/web/20180628231125/https://www.cnbc.com/2018/06/27/bill-gates-openai-robots-beating-humans-at-dota-2-is-ai-milestone.html |archive-date=2018-06-28 |access-date=2018-06-28}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
到2018年6月，這些機器人的能力已擴展為能以完整五人隊伍協同作戰，並能擊敗業餘及半職業玩家組成的隊伍。&amp;lt;ref&amp;gt;{{Cite web |title=OpenAI Five Benchmark |url=https://blog.openai.com/openai-five-benchmark/ |website=blog.openai.com |date=2018-07-18 |language=en |last=OpenAI |url-status=live |archive-url=https://web.archive.org/web/20180826043935/https://blog.openai.com/openai-five-benchmark/ |archive-date=2018-08-26 |access-date=2018-08-26}}&amp;lt;/ref&amp;gt;&amp;lt;ref name=&amp;quot;Simonite June 2018&amp;quot;/&amp;gt;&amp;lt;ref&amp;gt;{{Cite web |title=AI bots trained for 180 years a day to beat humans at Dota 2 |url=https://www.theverge.com/2018/6/25/17492918/openai-dota-2-bot-ai-five-5v5-matches |website=The Verge |date=2018-06-25 |language=en |last=Vincent |first=James |url-status=live |archive-url=https://web.archive.org/web/20180625183203/https://www.theverge.com/2018/6/25/17492918/openai-dota-2-bot-ai-five-5v5-matches |archive-date=2018-06-25 |access-date=2018-06-25}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Cite web |title=The OpenAI Dota 2 bots just defeated a team of former pros |url=https://www.theverge.com/2018/8/6/17655086/dota2-openai-bots-professional-gaming-ai |website=The Verge |date=2018-08-06 |language=en |last=Savov |first=Vlad |url-status=live |archive-url=https://web.archive.org/web/20180807113227/https://www.theverge.com/2018/8/6/17655086/dota2-openai-bots-professional-gaming-ai |archive-date=2018-08-07 |access-date=2018-08-07}}&amp;lt;/ref&amp;gt;在[[2018年Dota 2国际邀请赛|2018年Dota2國際邀請賽]]中，OpenAI Five 參與了兩場對抗職業戰隊的比賽，一場對陣總部位於[[巴西]]的paiN Gaming，另一場則面對由前中國籍選手組成的全明星隊伍。&amp;lt;ref&amp;gt;{{Cite magazine|last=Simonite|first=Tom|date=2018-08-24|title=Pro Gamers Fend off Elon Musk-Backed AI Bots—for Now|url=https://www.wired.com/story/pro-gamers-fend-off-elon-musks-ai-bots/|magazine=Wired|archive-url=https://web.archive.org/web/20180824120523/https://www.wired.com/story/pro-gamers-fend-off-elon-musks-ai-bots/|archive-date=2018-08-24|access-date=2018-08-25}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Cite web |title=Game over, machines: Humans defeat OpenAI bots once again at video games Olympics |url=https://www.theregister.co.uk/2018/08/24/openai_bots_eliminated_dota_2/ |website=The Register |language=en |last=Quach |first=Katyanna |url-status=live |archive-url=https://web.archive.org/web/20180825110329/https://www.theregister.co.uk/2018/08/24/openai_bots_eliminated_dota_2/ |archive-date=2018-08-25 |access-date=2018-08-25}}&amp;lt;/ref&amp;gt;儘管機器人在兩場比賽中皆告失利，OpenAI 仍認為此舉具備成功價值，指出與《Dota 2》中部分最佳選手對戰，使得他們能夠針對未來比賽進行演算法的分析與調整。&amp;lt;ref&amp;gt;{{Cite web |title=The International 2018: Results |url=https://blog.openai.com/the-international-2018-results/ |website=blog.openai.com |date=2018-08-24 |language=en |last=OpenAI |url-status=live |archive-url=https://web.archive.org/web/20180824131639/https://blog.openai.com/the-international-2018-results/ |archive-date=2018-08-24 |access-date=2018-08-25}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2019年4月，機器人最後一次公開展示，當時在[[旧金山|舊金山]]舉行的一場現場活動中，機器人以[[季後賽賽制|三局两胜制的]]比赛中擊敗了2018年國際邀请赛冠军[[OG (電子競技)|OG]] 。&amp;lt;ref&amp;gt;{{Cite web |title=OpenAI Five defeats professional Dota 2 team, twice |url=https://venturebeat.com/2019/04/13/openai-five-defeats-a-team-of-professional-dota-2-players/ |website=Venture Beat |date=2019-04-13 |last=Wiggers |first=Kyle |url-status=live |archive-url=https://web.archive.org/web/20190413210513/https://venturebeat.com/2019/04/13/openai-five-defeats-a-team-of-professional-dota-2-players/ |archive-date=2019-04-13 |access-date=2019-04-13}}&amp;lt;/ref&amp;gt;同月，舉辦了一場為期四天的公開線上活動，供大眾與機器人對戰。&amp;lt;ref name=&amp;quot;Statt April 2019&amp;quot;&amp;gt;{{Cite news |author=Statt |first=Nick |title=OpenAI&amp;#039;s Dota 2 AI steamrolls world champion e-sports team with back-to-back victories |url=https://www.theverge.com/2019/4/13/18309459/openai-five-dota-2-finals-ai-bot-competition-og-e-sports-the-international-champion |accessdate=2019-04-15 |work=The Verge |publisher=Vox Media |date=2019-04-13 |archiveurl=https://web.archive.org/web/20190415011925/https://www.theverge.com/2019/4/13/18309459/openai-five-dota-2-finals-ai-bot-competition-og-e-sports-the-international-champion |archivedate=2019-04-15 |language=en}}&amp;lt;/ref&amp;gt;在該活動中，機器人共參與42,729場公開比賽，勝率達 99.4%。&amp;lt;ref&amp;gt;{{Cite web |title=OpenAI&amp;#039;s Dota 2 bot defeated 99.4% of players in public matches |url=https://venturebeat.com/2019/04/22/openais-dota-2-bot-defeated-99-4-of-players-in-public-matches/ |website=Venture Beat |date=2019-04-22 |language=en |last=Wiggers |first=Kyle |access-date=2019-04-22 |archive-date=2019-07-11 |archive-url=https://web.archive.org/web/20190711151127/https://venturebeat.com/2019/04/22/openais-dota-2-bot-defeated-99-4-of-players-in-public-matches/ |dead-url=no }}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 建構 ==&lt;br /&gt;
每個OpenAI Five機器人都是一個[[神經網絡]]，該網絡包含一個單層 4096 單元的[[長短期記憶|LSTM]]&amp;lt;ref&amp;gt;{{Cite web |title=Dota 2 with Large Scale Deep Reinforcement Learning |url=https://cdn.openai.com/dota-2.pdf |website=OpenAI |url-status=live |archive-url=https://web.archive.org/web/20240926092329/https://cdn.openai.com/dota-2.pdf |archive-date=2024-09-26 |access-date=2024-09-29}}&amp;lt;/ref&amp;gt; ，用來觀察從Dota 開發者 API 提取的當前遊戲狀態。這個神經網絡通過眾多可能的行動頭（不涉及任何人類數據）來執行動作，而且每個行動頭都有其特定意義。例如，決定動作延遲的刻數、選擇哪個動作——以及該動作在單位周圍網格中的 X 或 Y 坐標。此外，各個行動頭都是獨立計算的。該 AI 系統將世界視為一個包含 20,000 個數字的列表，並通過生成一個包含八個枚舉值的列表來採取行動。同時，它還會選擇不同的動作和目標，以了解如何編碼每個動作並觀察世界。&amp;lt;ref name=&amp;quot;OpenAI June 2018&amp;quot;&amp;gt;{{Cite web |title=OpenAI Five |url=https://blog.openai.com/openai-five/ |website=blog.openai.com |date=2018-06-25 |language=en |last=OpenAI |url-status=live |archive-url=https://web.archive.org/web/20180625140124/https://blog.openai.com/openai-five/ |archive-date=2018-06-25 |access-date=2018-06-25}}&amp;lt;/ref&amp;gt; &lt;br /&gt;
&lt;br /&gt;
OpenAI Five 以「Rapid」基礎架構為平台，發展成一套通用的強化學習訓練系統。Rapid 由兩個層級組成：第一層負責啟動數千臺機器並協助它們彼此通訊；第二層則負責執行軟體。到 2018 年，OpenAI Five 在256顆[[圖形處理器|GPU]]與 128,000個 [[中央处理器|CPU]]核心的運算環境下，累計進行了約180年時間的強化學習遊戲，&amp;lt;ref&amp;gt;{{Cite web |title=Why are AI researchers so obsessed with games? |url=https://qz.com/1348177/why-are-ai-researchers-so-obsessed-with-games |website=QUARTZ |date=2018-08-04 |language=en |url-status=live |archive-url=https://web.archive.org/web/20180804131643/https://qz.com/1348177/why-are-ai-researchers-so-obsessed-with-games/ |archive-date=2018-08-04 |access-date=2018-08-04}}&amp;lt;/ref&amp;gt;採用了一種稱為[[近端策略优化]]的策略梯度方法。 &amp;lt;ref name=&amp;quot;OpenAI June 2018&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;{{Cite arXiv |arxiv=1707.06347 |class=cs.LG |first=John |last=Schulman |first2=Filip |last2=Wolski |title=Proximal Policy Optimization Algorithms}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable sortable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|+比较图表&lt;br /&gt;
!&lt;br /&gt;
!OpenAI 1v1 机器人（2017 年）&lt;br /&gt;
! OpenAI Five（2018 年）&lt;br /&gt;
|-&lt;br /&gt;
| align=&amp;quot;left&amp;quot; | CPU&lt;br /&gt;
| [[Microsoft Azure]]上有 60,000 个 CPU 核心&lt;br /&gt;
|[[Google雲端平台|Google Cloud Platform]] (GCP) 上的 128,000 个可抢占 CPU 核心&lt;br /&gt;
|-&lt;br /&gt;
| align=&amp;quot;left&amp;quot; |GPU&lt;br /&gt;
| Azure 上有 256 个 K80 GPU&lt;br /&gt;
| GCP 上有 256 个 P100 GPU&lt;br /&gt;
|-&lt;br /&gt;
| align=&amp;quot;left&amp;quot; |收集的经验&lt;br /&gt;
|每天约 300 年&lt;br /&gt;
|每天约 180 年&lt;br /&gt;
|-&lt;br /&gt;
| align=&amp;quot;left&amp;quot; |观察的大小&lt;br /&gt;
|~3.3kB&lt;br /&gt;
| ~36.8kB&lt;br /&gt;
|-&lt;br /&gt;
| align=&amp;quot;left&amp;quot; |每秒游戏观察次数&lt;br /&gt;
|10&lt;br /&gt;
| 7.5&lt;br /&gt;
|-&lt;br /&gt;
| align=&amp;quot;left&amp;quot; |批次大小&lt;br /&gt;
|8,388,608 条观察结果&lt;br /&gt;
|1,048,576 条观察结果&lt;br /&gt;
|-&lt;br /&gt;
| align=&amp;quot;left&amp;quot; |每分钟批次数&lt;br /&gt;
|~20&lt;br /&gt;
| ~60&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== 與其他遊戲AI系統的比較 ==&lt;br /&gt;
在OpenAI Five之前，其他AI對抗人類的實驗和系統已經成功運作，例如使用[[沃森 (人工智能程序)|Watson]]的《危險邊緣》，使用[[深藍 (超級電腦)|深藍]]的[[西洋棋]]以及使用[[AlphaGo]]的[[围棋]]。 &amp;lt;ref&amp;gt;{{Cite news |url=https://www.theguardian.com/technology/2011/feb/17/ibm-computer-watson-wins-jeopardy |title=IBM computer Watson wins Jeopardy clash |work=The Guardian |accessdate=2011-02-17 |date=2011-02-17 |author=Gabbatt |first=Adam |archiveurl=https://web.archive.org/web/20130921060018/http://www.theguardian.com/technology/2011/feb/17/ibm-computer-watson-wins-jeopardy |archivedate=2013-09-21}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;&lt;br /&gt;
{{Cite web |title=Chess grandmaster Garry Kasparov on what happens when machines &amp;#039;reach the level that is impossible for humans to compete&amp;#039; |url=https://www.businessinsider.com/garry-kasparov-talks-about-artificial-intelligence-2017-12 |website=Business Insider |url-status=live |archive-url=https://web.archive.org/web/20171229122316/http://www.businessinsider.com/garry-kasparov-talks-about-artificial-intelligence-2017-12 |archive-date=2017-12-29 |access-date=2017-12-29}}&lt;br /&gt;
&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Cite web |title=DeepMind&amp;#039;s Go-playing AI doesn&amp;#039;t need human help to beat us anymore |url=https://www.theverge.com/2017/10/18/16495548/deepmind-ai-go-alphago-zero-self-taught |website=Verge |date=2017-10-18 |url-status=live |archive-url=https://web.archive.org/web/20171018195425/https://www.theverge.com/2017/10/18/16495548/deepmind-ai-go-alphago-zero-self-taught |archive-date=2017-10-18 |access-date=2017-10-18}}&amp;lt;/ref&amp;gt;与與其他曾使用 AI 系統與人類玩家對戰的遊戲相比，Dota 2的不同之處如下所述&amp;lt;ref name=&amp;quot;OpenAI June 2018&amp;quot; /&amp;gt;：&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;長期觀察&amp;#039;&amp;#039;&amp;#039;：機器人以每秒30幀運行，而一場平均比賽持續45分鐘，這使得每場比賽包含 80,000次運算。OpenAI Five每四幀觀察一次，從而產生20,000個動作。相比之下，國際象棋通常在不到40步就結束，而圍棋則不到150步。&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;部分觀察到的遊戲狀態&amp;#039;&amp;#039;&amp;#039;：玩家及其盟友只能看到直接圍繞他們的地圖，其餘部分則被「[[战争迷雾|戰爭迷霧]]」覆蓋，迷霧會隱藏敵方單位及其動向。因此，進行《Dota 2》遊戲需要根據這些不完整的資料進行推斷，並同時預測對手可能採取的行動。相比之下，國際象棋與圍棋是「完全資訊遊戲」，因為它們不會對對手隱藏任何資訊。&amp;lt;ref name=&amp;quot;Knight June 2018&amp;quot;&amp;gt;{{Cite web |title=A team of AI algorithms just crushed humans in a complex computer game |url=https://www.technologyreview.com/s/611536/a-team-of-ai-algorithms-just-crushed-expert-humans-in-a-complex-computer-game |website=MIT Tech Review |date=2018-06-25 |language=en |last=Knight |first=Will |access-date=2018-06-25 |archive-date=2018-06-26 |archive-url=https://web.archive.org/web/20180626011941/https://www.technologyreview.com/s/611536/a-team-of-ai-algorithms-just-crushed-expert-humans-in-a-complex-computer-game/ |dead-url=no }}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;連續動作空間&amp;#039;&amp;#039;&amp;#039;：在《Dota 2》遊戲中，每個可操作的角色（英雄）可以執行數十種動作，這些動作的目標可以是另一個單位或一個位置。OpenAI Five 的開發者將每個英雄的動作空間設置為 170,000 種可能的動作。不計算遊戲中那些持續性的因素，每個 tick 平均有約 1,000 種有效動作。相比之下，國際象棋的平均動作數為 35，而圍棋則為 250。&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;連續觀察空間&amp;#039;&amp;#039;&amp;#039;：《Dota 2》是在一個大型地圖上進行的遊戲，地圖上有十位英雄（每隊五位），以及數十座建築和非玩家角色（NPC）單位。OpenAI 系統透過開發者提供的 bot API 觀察遊戲狀態，並將其表示為 20,000 個數字，這些數字構成了人類所能獲取的所有資訊。一個棋盤大約由 70 個列表表示，而一個圍棋盤則有大約 400 個枚舉數據。&lt;br /&gt;
&lt;br /&gt;
== 評價 ==&lt;br /&gt;
OpenAI Five獲得了人工智慧、科技和電子遊戲界的廣泛認可。[[微软]]創辦人[[比尔·盖茨]]稱其為「一項重大突破」，因為它們的勝利「需要團隊合作與協作」&amp;lt;ref name=&amp;quot;Clifford June 2018&amp;quot;/&amp;gt;&amp;lt;ref&amp;gt;{{Cite web |title=Bill Gates hails &amp;#039;huge milestone&amp;#039; for AI as bots work in a team to destroy humans at video game &amp;#039;Dota 2&amp;#039; |url=https://www.businessinsider.com/bill-gates-hails-huge-milestone-for-ai-as-bots-beat-humans-at-dota-2-2018-6 |website=Business Insider |language=en |url-status=live |archive-url=https://web.archive.org/web/20180627131504/http://www.businessinsider.com/bill-gates-hails-huge-milestone-for-ai-as-bots-beat-humans-at-dota-2-2018-6 |archive-date=2018-06-27 |access-date=2018-06-27}}&amp;lt;/ref&amp;gt;曾在1997年敗給深藍的西洋棋冠軍[[加里·卡斯帕羅夫|加里·卡斯帕罗夫]]表示 ，儘管 OpenAI Five 在 2018 年國際邀請賽表現不佳，但這些機器人最終「一定會達成目標，而且比預期還要快」。&amp;lt;ref&amp;gt;{{Cite web |title=Garry Kasparov&amp;#039;s Twitter |url=https://twitter.com/Kasparov63/status/1033108573151092736 |date=2018-08-24 |language=en |access-date=2018-08-24 |archive-date=2020-07-09 |archive-url=https://web.archive.org/web/20200709054745/https://twitter.com/Kasparov63/status/1033108573151092736 |dead-url=no }}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
在《[[麻省理工科技評論|麻省理工技术评论]]》的採訪中，AI 專家們也認為OpenAI Five 系統是一項重大成就，因為他們指出Dota 2是一款「極其複雜的遊戲」，因此即使能夠擊敗非職業玩家也已經相當令人印象深刻。&amp;lt;ref name=&amp;quot;Knight June 2018&amp;quot;/&amp;gt; 《[[PC Gamer]]》則表示，OpenAI Five 戰勝職業玩家是一個機器學習領域的重要里程碑。&amp;lt;ref&amp;gt;{{Cite news |author=Park |first=Morgan |title=How the OpenAI Five tore apart a team of Dota 2 pros |url=https://www.pcgamer.com/how-the-openai-five-tore-apart-a-team-of-dota-2-pros/ |accessdate=2020-05-25 |work=PC Gamer |date=2018-10-11 |language=en |archive-date=2019-12-25 |archive-url=https://web.archive.org/web/20191225111154/https://www.pcgamer.com/how-the-openai-five-tore-apart-a-team-of-dota-2-pros/ |dead-url=no }}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
相比之下，《[[Motherboard]]》則認為這場勝利「基本上是在作弊」，原因包括雙方英雄池被大幅簡化，以及機器人能夠直接存取 API，而非像人類玩家一樣透過[[電腦視覺]]來解析螢幕上的像素。&amp;lt;ref&amp;gt;{{Cite news |author=Gault |first=Matthew |title=OpenAI Is Beating Humans at &amp;#039;Dota 2&amp;#039; Because It&amp;#039;s Basically Cheating |url=https://www.vice.com/en_us/article/gy3nvq/ai-beat-humans-at-dota-2 |accessdate=2020-05-25 |work=Vice |date=2018-08-17 |language=en |archive-date=2020-05-28 |archive-url=https://web.archive.org/web/20200528011156/https://www.vice.com/en_us/article/gy3nvq/ai-beat-humans-at-dota-2 |dead-url=no }}&amp;lt;/ref&amp;gt; 《[[The Verge]]》則寫道，這些機器人證明了 OpenAI 在強化學習方面的研究方向以及其 AI 發展理念正在「產生重要的里程碑式成果」。&amp;lt;ref name=&amp;quot;Statt April 2019&amp;quot;/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2019年，DeepMind 推出了類似《星海爭霸2》的AI機器人——[[AlphaStar]]。與 OpenAI Five 一樣，AlphaStar 採用了強化學習和自我對弈技術。《The Verge》報導稱：「這類 AI 研究的目標不僅僅是為了在人類玩家面前取得壓倒性勝利，以證明其可行性。相反，它的目標是證明，只要投入足夠的時間、精力和資源，先進的 AI 軟體幾乎可以在任何競爭性的認知挑戰中擊敗人類，無論是桌遊還是現代電子遊戲。」他們還補充說，DeepMind和OpenAI的勝利也證明了強化學習在某些應用場景下的強大潛力。&amp;lt;ref&amp;gt;{{Cite news |author=Statt |first=Nick |title=DeepMind&amp;#039;s StarCraft 2 AI is now better than 99.8 percent of all human players |url=https://www.theverge.com/2019/10/30/20939147/deepmind-google-alphastar-starcraft-2-research-grandmaster-level |accessdate=2020-05-25 |work=The Verge |date=2019-10-30 |language=en |archive-date=2020-02-26 |archive-url=https://web.archive.org/web/20200226053600/https://www.theverge.com/2019/10/30/20939147/deepmind-google-alphastar-starcraft-2-research-grandmaster-level |dead-url=no }}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
OpenAI 希望該技術能夠應用於數位領域以外的範疇。2018年，該公司成功將 OpenAI Five 所使用的強化學習演算法及訓練程式碼，重新運用於[[OpenAI|Dactyl]] 項目，此項目研發出一隻具有人形特徵的機械手，搭載神經網絡以操控實體物體。&amp;lt;ref&amp;gt;{{Cite arXiv |arxiv=1808.00177v5 |class=cs.LG |author=OpenAI |first2=Marcin |last2=Andrychowicz |title=Learning Dexterous In-Hand Manipulation |date=2019}}&amp;lt;/ref&amp;gt;2019年，Dactyl破解了[[魔方|魔術方塊]]。 &amp;lt;ref&amp;gt;{{Cite arXiv |arxiv=1910.07113v1 |class=cs.LG |author=OpenAI |first2=Ilge |last2=Akkaya |title=Solving Rubik&amp;#039;s Cube with a Robot Hand |date=2019}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 參考資料 ==&lt;br /&gt;
{{Reflist|30em}}&lt;br /&gt;
&lt;br /&gt;
== 外部链接 ==&lt;br /&gt;
{{Portal|Video games}}&lt;br /&gt;
&lt;br /&gt;
* {{Official website|https://openai.com/five/}}&lt;br /&gt;
* {{Official website|https://blog.openai.com/openai-five/|官方部落格}}&lt;br /&gt;
{{OpenAI}}&lt;br /&gt;
[[Category:OpenAI]]&lt;br /&gt;
[[Category:Dota系列]]&lt;br /&gt;
[[Category:应用机器学习]]&lt;br /&gt;
[[Category:2017年软件]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Sakura286</name></author>
	</entry>
</feed>