编辑“︁
Intel Larrabee
”︁(章节)
跳转到导航
跳转到搜索
Template:Editnotice load/content
警告:
您没有登录。如果您进行任何编辑,您的IP地址会公开展示。如果您
登录
或
创建账号
,您的编辑会以您的用户名署名,此外还有其他益处。
反垃圾检查。
不要
加入这个!
== 架構 == 英特爾的Larrabee圖形處理專案完全有別於現時所有圖形處理技術(包括英特爾自家的整合式顯示核心),不同於[[超微半导体|超微]]以及[[輝達]]一直以來使用的僅有圖形運算指令的[[流處理]]技術,而是基於自家的[[x86架構]],指令方面除了擁有部分新的圖形處理指令以外保有大量的x86指令,使得Larrabee擁有比競爭對手更為靈活的可程式化特性以及更為強大的通用運算處理能力,算是英特爾發展多核心x86並行運算架構的一個延伸。<ref name="cnetnews1">{{cite web | url=http://www.cnetnews.com.cn/2008/0806/1041227.shtml | title=Intel披露独立显卡芯片Larrabee详细资料 | publisher=CNETNews.com.cn | work=CNETNews.com.cn | date=2008-08-06 | accessdate=2013-05-20 | archive-date=2013-11-14 | archive-url=https://web.archive.org/web/20131114193413/http://cnetnews.com.cn/2008/0806/1041227.shtml | dead-url=no }}</ref> [[File:Larrabee slide block diagram.svg|300px|thumb|右|Intel Larrabee的核心佈局略圖]] === x86「IA」核心 === 與當時以及現時一般的圖形處理器不同,一般的圖形處理器是採用[[流處理|流式處理器]]作為核心運算單元/渲染器。而Larrabee採用x86架構的,稱為「IA」的處理核心,概念上就是傳統CPU核心,這些處理單元就是傳統意義上的[[著色器]]或核心運算單元,不過就單個運算單元而言,一個「IA」核心的資料吞吐量要比單個流式處理器/算術邏輯單元要高得多。就單個核心而言,對比當下的CPU核心,「IA」核心也只是微核心。<ref name="45it1">{{cite web | url=http://www.45it.com/cpu/200808/19815.htm | title=英特尔新一代显卡架构Larrabee解析 | publisher=45it.com | work=天极yesky | date=2008-08-30 | accessdate=2013-05-21 | archive-date=2013-06-28 | archive-url=https://archive.today/20130628094247/http://www.45it.com/cpu/200808/19815.htm | dead-url=no }}</ref> [[File:Intel Pentium arch.svg|300px|缩略图|右|奔騰P54C核心的架構圖]] 事實上,每個「IA」核心基於舊有的首代[[Pentium|奔騰P54C]]核心改造而來,而非當時最新的[[Intel Nehalem|Nehalem架構]]處理器核心,英特爾認為,當年僅具有五級[[流水线 (计算机)|流水線]]且僅能依序執行的奔騰P54C核心,相比擁有14級管線的擁有複雜的[[亂序執行]]結構的Nehalem,更有圖形化改造潛力,而且奔騰核心即使經過改造使核心規模擴增,透過晶片製程工藝的發展改進,多x86核心更易於達成。<ref>{{cite web | url=http://www.solidot.org/story?sid=6940 | title=Intel的Larrabee显卡基于古老的Pentium架构 | accessdate=2013-05-20 | archive-date=2019-06-20 | archive-url=https://web.archive.org/web/20190620054146/https://www.solidot.org/story?sid=6940 | dead-url=no }}</ref>預計將採用45奈米甚至是32或22奈米。<ref>{{Cite web |url=http://www.hardspell.com/doc/hard/79437.htm |title=Larrabee 独显很可能采用 32nm 制程工艺 |accessdate=2008-08-05 |archive-date=2008-11-20 |archive-url=https://web.archive.org/web/20081120094934/http://www.hardspell.com/doc/hard/79437.htm |dead-url=no }}</ref>2008年8月,英特爾稱Larrabee晶片內的核心數量上可以隨意增加或減少,以8的倍數改變,而且效能在8至48核心數量範圍內基本上成線性關係,英特爾官方報稱浮點性能可達到TeraFLOPS級別。<ref name="cnetnews1"/>所有的「IA」核心,運作頻率會是2.0GHz。Intel聲稱,這個時脈下32個「IA」核心時的顯示核心運算效能可以達到2TeraFLOPS。<ref>{{Cite web |url=http://news.mydrivers.com/1/110/110657.htm |title=奔腾归来:Intel Larrabee 基于 P5 架构 |accessdate=2008-07-09 |archive-date=2011-12-12 |archive-url=https://web.archive.org/web/20111212044049/http://news.mydrivers.com/1/110/110657.htm |dead-url=no }}</ref>處理器仍採用順序而非亂序執行架構。<ref>{{Cite web |url=http://www.inpai.com.cn/doc/hard/85725_3.htm |title=Intel 制霸显卡新起点 Larrabee 全解析 |accessdate=2008-12-25 |archive-date=2008-12-24 |archive-url=https://web.archive.org/web/20081224030732/http://www.inpai.com.cn/doc/hard/85725_3.htm |dead-url=no }}</ref>整個「IA」核心內部是[[多指令流多数据流|多指令流多資料流]]([[MIMD]])形式佈局,兩個整數[[算術邏輯單元]]使用各自的指令發射端,而16個ALU的浮點單元則以[[單指令流多資料流]](SIMD)的形式共用一個指令發射端。<ref name="extremetech1">{{cite web | url=http://www.extremetech.com/computing/131699-larrabee-lives-50-core-intel-xeon-phi-unveiled-lures-supercomputers-away-from-nvidia-tesla | title=Larrabee lives! 50-core Intel Xeon Phi unveiled, lures supercomputers away from Nvidia Tesla | publisher=EXTREMETECH | date=2012-06-26 | accessdate=2013-05-20 | archive-date=2020-11-12 | archive-url=https://web.archive.org/web/20201112034134/http://www.extremetech.com/computing/131699-larrabee-lives-50-core-intel-xeon-phi-unveiled-lures-supercomputers-away-from-nvidia-tesla | dead-url=no }}</ref> [[File:Larrabee block diagram (Total pic. and CPU core bloack).PNG|300px|缩略图|右|英特爾公佈的「IA」核心架構圖]] 英特爾在舊有的奔騰P54C核心上,新增執行緒分派單元、二級快取、矢量運算單元及其暫存器、超執行緒等、刪減前段匯流排(FSB)改以環形匯流排節點替代。即使是既有單元,也作了大量的修改變更。因此Larrabee並非單純是奔騰P54C改進。<ref name="Impress Watch P3"/> ==== 浮點運算 ==== 新增512[[位元]][[SIMD]][[矢量]]單元,由16個/寬幅,32位元的矢量[[ALU]]組成,共用一個指令發射端,相當於現在CPU核心內部的[[浮點運算單元]],但對比當時的[[Core 2|Core 2 DUO]]僅有的8寬幅的32位元浮點運算單元每核心每時鐘週期僅能進行8次單精度[[浮點運算]],各「IA」核心每時鐘週期能進行16次單精度(32位元)浮點運算。若以Larrabee擁有10個核心去計算,每個周期一共可以支援160個單精度[[矢量]]運算;Core 2 Duo雙核心處理器只可以支援16個。<ref name="45it1"/>所以,Larrabee的[[浮点]]运算性能比傳統的處理器強。核心亦支援一套新的矢量指令集,用作矢量記憶體、整数和浮点計算。浮点运算方面,支援[[IEEE]]標準的單雙精度。<ref>{{Cite web |url=http://news.mydrivers.com/1/101/101685.htm |title=Intel 独立显卡 Larrabee 三季度出样 |accessdate=2008-06-02 |archive-date=2016-10-29 |archive-url=https://web.archive.org/web/20161029044432/http://news.mydrivers.com/1/101/101685.htm |dead-url=no }}</ref><ref name="Impress Watch P3"/> 與NVIDIA的[[GeForce 8]]相似,每一個矢量運算單元在一個周期中,只會運算一個顏色數據,務求提升單元的使用率。不過,在數據流通方面,一切都是以代碼形式出現。而傳統的[[顯示核心]],一般都會使用專門的逻辑單元,去管理資料流通。<ref name="siggraph">{{citeweb|title=Larrabee: A Many-Core x86 Architecture for Visual Computing|url=http://softwarecommunity.intel.com/UserFiles/en-us/File/larrabee_manycore.pdf|publisher=''[[Intel]]''|accessdate=2008-08-06|doi=10.1145/1399504.1360617|deadurl=yes|archiveurl=https://web.archive.org/web/20080920230821/http://softwarecommunity.intel.com/UserFiles/en-us/File/larrabee_manycore.pdf|archivedate=2008-09-20}}</ref> ==== 整數運算 ==== 但在[[標量]]/[[整數]]數據中,主流處理器始終較有優勢。Core 2 Duo是單核每周期處理四個,Larrabee只是單核兩個。二級[[快取|緩衝記憶體]]方面,每一個核心將會擁有256KB。Larrabee並非是單純建基於舊的Pentium核心,指令解碼除了奔騰原有的指令以外,新增Larrabee專用純量指令以及新的x86指令,純量運算單元也加入對新指令的支援,在每一個純量單元中,由兩個負責純量運算的算術邏輯單元組成,組成一個主要和辅助指令執行管线,擁有各自對應的指令發射端。一個可以處理x86或新引入的Larrabee標量指令集,一個用來處理簡單的[[ALU]]計算或者x86指令集的子集命令。<ref name="Impress Watch P3"/> ==== 超執行緒 ==== Larrabee還會有特殊的[[超執行緒]]特性,支援單核執行四條[[執行緒]]。為支援單核四路超執行緒技術,矢量和標量單元各自擁有4組暫存器。<ref name="Impress Watch P3"/> ==== 快取架構 ==== 原有的一級資料和指令快取均由8KB擴增至32KB,其位寬也擴增至512位元;二級快取容量為256KB,每核心獨占;記憶體[[定址欄位|寻址]]能力亦達到[[64位元]],與現代的處理器相若。<ref name="Impress Watch P3"/> === 圖形引擎 === 英特爾曾經聘請了專注[[光线跟踪]]的研究員,預計Larrabee顯示核心可以支援相關技術。<ref>{{Cite web |url=http://news.mydrivers.com/1/100/100037.htm |title=Intel 独立显卡 Larrabee 支持光线追踪 |accessdate=2008-06-02 |archive-date=2016-03-04 |archive-url=https://web.archive.org/web/20160304124159/http://news.mydrivers.com/1/100/100037.htm |dead-url=no }}</ref> 在[[DirectX]]和[[OpenGL]]中,仍然會使用[[栅格化]]渲染,但將以軟體實現。<ref>{{Cite web |url=http://news.mydrivers.com/1/104/104606.htm |title=Intel:光线追踪不是 Larrabee 的重点 |accessdate=2008-06-02 |archive-date=2016-03-04 |archive-url=https://web.archive.org/web/20160304105823/http://news.mydrivers.com/1/104/104606.htm |dead-url=no }}</ref>而且,這種以軟體方式實現的光線追踪、光柵化等作業將簡化程式碼。<ref>{{cite web | url=http://news.mydrivers.com/1/145/145352.htm | title=IDF第二日 Intel再次展示Larrabee显卡 | publisher=mydrivers.com | date=2009-09-24 | accessdate=2013-05-21 | archive-date=2016-03-04 | archive-url=https://web.archive.org/web/20160304113527/http://news.mydrivers.com/1/145/145352.htm | dead-url=no }}</ref> 不過傳統的[[紋理]]/[[材質]]的採樣、解壓縮、混合等作業仍由固定功能的紋理材質單元處理。但紋理/材質等快取則是以x86資料的形式暫存於IA核心內的二級快取上,須進入「IA」核心存取,因此,紋理單元亦具有虛擬位址轉換特性來存取這些資料。<ref name="Impress Watch P3">{{cite web | url=http://digital.yesky.com/dylf/itwatch/34/8446534_2.shtml | title=后藤弘茂:英特尔Larrabee架构新指令剖析 | publisher=yesky.com | work=Impress Watch | date=2008-10-02 | accessdate=2013-05-21 }}{{Dead link|date=2019年10月 |bot=InternetArchiveBot |fix-attempted=yes }}</ref><ref name="zdnet2">{{cite web | url=http://server.zdnet.com.cn/files/all-1543447.htm | title=剖析Larrabee利器之共享虚拟内存 | publisher=zdnet.com | date=2009-12-08 | accessdate=2013-05-21 | archive-date=2016-03-04 | archive-url=https://web.archive.org/web/20160304185553/http://server.zdnet.com.cn/files/all-1543447.htm | dead-url=no }}</ref><ref name="Impress Watch P3"/> === 圖形程式介面 === Larrabee可以同時支援[[DirectX]]和[[OpenGL]]。由於是通用核心,亦可以支援物理加速<ref>{{Cite web |url=http://news.mydrivers.com/1/110/110441.htm |title=Intel:Larrabee 浮点运算能力 2TFlops |accessdate=2008-07-07 |archive-date=2016-03-04 |archive-url=https://web.archive.org/web/20160304135852/http://news.mydrivers.com/1/110/110441.htm |dead-url=no }}</ref>。圖形[[API]]方面,它支援主流的 [[DirectX]]和[[OpenGL]],而Intel亦會推出自家的標準。目的是充分發揮多[[x86]]核心的性能。<ref name="pcpop1">{{cite web | url=http://www.pcpop.com/doc/0/387/387814_all.shtml#p2 | title=X86架构的GPU?解读Larrabee规格特性 | publisher=pcpop.com | work=Tom's Hardware | date=2009-04-10 | accessdate=2013-05-20 | archive-date=2016-04-04 | archive-url=https://web.archive.org/web/20160404183759/http://www.pcpop.com/doc/0/387/387814_all.shtml#p2 | dead-url=no }}</ref><ref>{{cite web | url=http://tech.sina.com.cn/h/2008-07-17/1923737319.shtml | title=Intel之呐喊 Larrabee无需DirectX | publisher=sina.com.cn | work=小熊在线 | date=2008-07-17 | accessdate=2013-05-20 | archive-date=2016-03-04 | archive-url=https://web.archive.org/web/20160304220915/http://tech.sina.com.cn/h/2008-07-17/1923737319.shtml | dead-url=no }}</ref> [[消除混疊]]技術方面,除了傳統的[[MSAA]]等抗鋸齒技術,還會實作利用CPU進行的[[形態過濾抗鋸齒]]([[MLAA]])。MLAA是一種後期[[抗鋸齒]]技術,雖然由英特爾最先提出,但最先實作此技術的是AMD,AMD在發布[[AMD Radeon HD 6000|Radeon HD 6000系列]]顯示核心時率先引入,後來Radeon HD 5000也予以支援。<ref>[http://server.zdnet.com.cn/server/2011/0725/2048803.shtml Intel:且看CPU怎么实现MLAA抗锯齿] {{Wayback|url=http://server.zdnet.com.cn/server/2011/0725/2048803.shtml |date=20160804171512 }} - zdnet.com.cn</ref> === 通用運算以及硬體加速 === 支援x86指令集、新增Larrabee指令集,使得普通的程式語言也能方便調用GPU以實現GPU加速,非常明確的[[GPGPU]]的設計方向。不同於對手輝達和超微需要專門的應用程式介面,而且還需要額外的學習過程方能方便使用。<ref name="pcpop1"/> 針對[[影像]]方面,Larrabee顯示核心內有專門的影像處理單元。<ref>{{Cite web |url=http://news.mydrivers.com/1/113/113026.htm |title=Intel 透露 Larrabee 架构细节 |accessdate=2008-08-04 |archive-date=2016-03-04 |archive-url=https://web.archive.org/web/20160304200458/http://news.mydrivers.com/1/113/113026.htm |dead-url=no }}</ref> === 匯流排以及記憶體介面 === Larrabee顯示核心內部使用環形[[匯流排]],與[[冶天科技|ATI]]的[[Radeon R600]]相似,但每個方向是512位元(雙向1024位元),而顯示記憶體與其控制器的連接仍採用CrossBar的形式,而Radeon R600是顯示記憶體和其控制器之間使用單向256位元(雙向512位元)的環形匯流排。<ref>{{Cite web |url=http://news.mydrivers.com/1/113/113034.htm |title=Intel Larrabee:核心翻番、性能翻番 |accessdate=2008-08-04 |archive-date=2011-12-12 |archive-url=https://web.archive.org/web/20111212044409/http://news.mydrivers.com/1/113/113034.htm |dead-url=no }}</ref> 各「IA」核心、[[記憶體控制器|顯示記憶體控制器]]、圖形引擎、PCI-E介面等亦使用此总线互相通讯。系統介面為[[PCI-E|PCI-E 2.0/2.1 x16]]。記憶體將使用[[GDDR5]][[顯示記憶體]],但也會相容[[GDDR3]]、[[GDDR4]]。<ref name="pcpop1"/><ref>{{cite web | url=http://www.enet.com.cn/article/2008/0805/A20080805341347.shtml | title=Intel Larrabee 核心翻番 性能翻番 | publisher=enet.com.cn | work=mydrivers.com | date=2008-08-05 | accessdate=2013-05-21 | deadurl=yes | archiveurl=https://web.archive.org/web/20160309050017/http://www.enet.com.cn/article/2008/0805/A20080805341347.shtml | archivedate=2016-03-09 }}</ref><ref>[http://digi.163.com/08/1126/09/4RLQ8QKM001618J1.html Intel于i7后重大举措 Larrabee显卡雏形] {{Wayback|url=http://digi.163.com/08/1126/09/4RLQ8QKM001618J1.html |date=20190216181533 }} - 163.com</ref>Larrabee核心內部還會實現虛擬記憶體共享,可以使CPU存取顯示記憶體中的資料,而GPU也可存取主記憶體中的資料。<ref name="zdnet2"/> === 電源管理 === Larrabee面世時的產品並沒有配備任何節能技術,原來英特爾x86 CPU上常見的C1E/[[EIST]]等節電技術並沒有移植到「IA」核心上。英特爾聲稱第二代的Larrabee顯示核心將會加入一些節電技術。<ref>{{cite web | url=http://www.qqread.com/hardware/server/2008/07/d420314.html | title=英特尔Larrabee显卡不支持节能技术 | work=Fudzilla | date=2008-07-16 | accessdate=2013-05-21 | archive-url=https://web.archive.org/web/20160304092012/http://www.qqread.com/hardware/server/2008/07/d420314.html | archive-date=2016-03-04 | dead-url=yes }}</ref>
摘要:
请注意,所有对Local Chinese Wikipedia的贡献均可能会被其他贡献者编辑、修改或删除。如果您不希望您的文字作品被随意编辑,请不要在此提交。
您同时也向我们承诺,您提交的内容为您自己所创作,或是复制自公共领域或类似自由来源(详情请见
Project:著作权
)。
未经许可,请勿提交受著作权保护的作品!
取消
编辑帮助
(在新窗口中打开)
导航菜单
个人工具
未登录
讨论
贡献
创建账号
登录
命名空间
页面
讨论
大陆简体
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
编辑
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息