BLAS

出自Local Chinese Wikipedia
跳至導覽 跳至搜尋

package.lua第80行Lua錯誤:module 'Module:CGroup/core' not found BLASTemplate:Langx,基礎線性代數程序集)是一個應用程式接口(API)標準,用以規範發佈基礎線性代數操作的數值庫(如矢量或矩陣乘法)。該程序集最初發佈於1979年,並用於建立更大的數值程序包(如LAPACK)。在高性能計算領域,BLAS被廣泛使用。例如,LINPACK的運算成績則很大程度上取決於BLAS中子程序DGEMM的表現。

為提高性能,各軟硬件廠商則針對其產品對BLAS接口實現進行高度最佳化。

BLAS級別[編輯]

BLAS按照功能被分為三個級別:[1]

  • Level 1:矢量-矢量運算
<math>\boldsymbol{y} \leftarrow \alpha \boldsymbol{x} + \boldsymbol{y} \!</math>
  • Level 2:矩陣-矢量運算
<math>\boldsymbol{y} \leftarrow \alpha A \boldsymbol{x} + \beta \boldsymbol{y} \!</math>
  • Level 3:矩陣-矩陣運算
<math>C \leftarrow \alpha A B + \beta C \!</math>

原理[編輯]

BLAS實現都一般對記憶體階層最佳化(Memory Hierarchy Optimization),使數據在快取重用、甚或減少轉譯後備緩衝區失誤(TLB miss)而提高運算效能。[2][3]

實現[編輯]

Netlib BLAS
官方參考實現,程序語言為Fortran 77[4]
ACML(AMD Core Math Library)
廠商AMD的BLAS實現。[5]
ATLAS
BSD許可證開源的BLAS實現。[6]
CUDA SDK
NVIDIA CUDA SDK包含了BLAS功能,通過C編程實現在GeForce 8系列或更新一代顯卡上運行。
GotoBLAS
腳本錯誤:沒有「ilh」這個模塊。後藤和茂開發的BSD許可證開源的BLAS實現,但已停止了活躍開發,後繼者為OpenBLAS。[7]
OpenBLAS
繼任GotoBLAS的開源BLAS的實現,主要由中國科學院軟件研究所並行軟件與計算科學實驗室進行開發。[8]
ESSL
IBM的科學工程數值庫ESSL,支持AIXLinux系統下的PowerPC架構。[9]
Intel MKL
Intel核心數學庫,支持PentiumIntel CoreItaniumCPU系列。實現平台包括Linux, WindowsOS X[10]
GSL
GNU科學數值庫(GNU Scientific Library)包含了GNU下的多平台C語言實現。
RenderScript IntrinsicBLAS
基於RenderscriptAndroid移動終端高性能BLAS實現。[11]

參考文獻[編輯]

外部連結[編輯]

package.lua第80行Lua錯誤:module 'Module:Navbar/configuration' not found