Radeon Instinct™ MI 系列融合人類本能與機器智慧,其設計從硬體的運算即採用開放方式。

Radeon Instinct 伺服器加速器產品系列藉由引進從硬體的運算即採用開放方式,帶領機器智慧和高效能運算系統邁向異質運算能力的新紀元。AMD 引進世界級的 GPU 技術,如新一代的「Vega」架構與 Radeon Instinct 開放生態系統方式,透過我們的 ROCm 軟體平台設計的資料中心可支援多種系統架構和業界標準互連技術,並可達成更高等級的效能與效率。

Radeon Instinct 產品系列的建置模組設計適合新一代的深度學習與 HPC 資料中心。AMD 的設計可最佳化 Radeon Instinct 伺服器加速器產品與軟體平台,為客戶提供符合成本效益的機器以及深度學習推論、訓練與邊緣訓練解決方案,使其工作負載達能充分運用我們加速器的超高平行運算能力。Radeon Instinct 亦是以資料為主 HPC 等級系統的理想選擇,適合學術機構、政府實驗室、能源、生命科學、金融、汽車和其他產業。

World’s Fastest Training Accelerator for Machine Intelligence and Deep Learning 4

Notify Me

Cost-Sensitive, Scalable Accelerator for Machine and Deep Learning Inference Applications

Notify Me

Versatile Training and Inference Accelerator for Machine Intelligence and Deep Learning

Notify Me

探索 Radeon Instinct™ MI 系列

探索

Compute UnitsTFLOPSMemory SizeMemory Bandwidth
Radeon Instinct™ MI25
Radeon Instinct™ MI25   64 nCU
4096 Stream Processors
  24.6/12.3
FP16 / FP32 Performance
  16GB
 
  484 GB/s
 
Radeon Instinct™ MI8
Radeon Instinct™ MI8   64
4096 Stream Processors
  8.2
FP16 and FP32Performance
  4GB
 
  512 GB/s
 
Radeon Instinct™ MI6
Radeon Instinct™ MI6   36
2304 Stream Processors
  5.7
FP16 and FP32Performance
  16GB
 
  224 GB/s
 

運算與機器智慧的新紀元

超大規模與 HPC 等級的異質運算,適合工作負載繁重的機器智慧、深度學習和 HPC。

Radeon Instinct 為客戶的資料中心帶來新一代的機器智慧功能。

AMD 的 Radeon Instinct 產品系列結合我們的對異質運算採取的開放生態系統方式,提高了可達成效能的標準、效率和彈性,設計的資料中心才能因應現今以資料為主深度學習和 HPC 工作負載所面臨的挑戰。

開放發展生態系統

ROCm 開放軟體平台,適合 HPC 等級機架規模

可擴充且原始碼完全開放的 AMD ROCm 軟體平台。包含針對可擴充多 GPU 運算最佳化 Linux® 驅動程式的 ROCm 軟體平台支援多重程式設計模式的使用,並且支援使用使用異質運算編譯器 (HCC) 的 GPU 加速,讓程式設計人員能夠輕鬆以 C++ 程式語言輕鬆處理程式碼,以及為異質運算提供完全的機器控制。

運用 ROCm 軟體平台上更容易也更有彈性的程式設計模式。Radeon Instinct 伺服器加速器與 AMD 的 ROCm 軟體平台完全相容,提供較之前支援 ISO C++、OpenCL™、CUDA(透過 AMD HIP 轉換工具)和 Python 1 (透過 Anaconda 的 NUMBA)更容易也更有彈性的程式設計模式。

從硬體即採用開放原始碼的編譯器、工具和檔案庫。Radeon Instinct 的開放生態系統方式與 ROCm 軟體平台支援使用開放原始碼異質運算編譯器 HCC) 的 GPU 加速,讓程式開發人員能夠以 C++ 程式語言輕鬆處理程式碼,並且為異質運算提供完全的機器控制。ROCm 提供豐富且與 HSA 1.1 相容的系統執行階段,以及大型應用程式、編譯器和語言執行階段開發所需的重要功能。ROCm 平台亦提供豐富的開發工具與檔案庫生態系統, 包含可用於將以 CUDA 撰寫的程式碼移植到 C++ 和 MIOpen 的移植異質介面 (HIP) 工具、免費且開放的 GPU 加速器程式碼檔案庫,讓開發人員能夠在 ROCm 平台上建構高效能的機器智慧架構,其中包含預計支援的 Caffe、Torch、TensorFlow 和 MxNet 等。 2

開放產業架構與互連技術支援。Radeon Instinct 異質運算的開放生態系統方式支援大部分的業界系統架構,包含 x86、Power8 和 ARM,以及產業標準互連技術,讓客戶有能力設計採用新一代運算技術的最佳化資料中心。 3

我們的熱情在於遊戲。我們的工作絕對專業。我們的本能則一直都是運算。這就是 Radeon Instinct 的真正意義。

Raja Koduri, 資深副總暨總設計師 at Radeon Technologies Group
  1. Python 的支援已規劃,但仍在開發中。
  2. 機器智慧架構的支援已規劃。請參閱 www.GPUOpen.com 網站以取得架構可用性。
  3. 計畫支援的多重架構包含 x86、Power8 和 ARM AMD 亦支援產業標準互連技術,包含 GenZ、CCIX 和 OpenCAPI™。支援架構與產業標準互連技術的時間點與可用性將有所不同。請與您的系統廠商聯繫以確認您的特定系統是否具備架構/技術支援。
  4. Measurements conducted by AMD Performance Labs as of June 2, 2017 on the Radeon Instinct™ MI25 “Vega” architecture based accelerator. Results are estimates only and may vary. Performance may vary based on use of latest drivers. PC/system manufacturers may vary configurations yielding different results. The results calculated for Radeon Instinct MI25 resulted in 24.6 TFLOPS peak half precision (FP16) and 12.3 TFLOPS peak single precision (FP32) floating-point performance. AMD TFLOPS calculations conducted with the following equation: FLOPS calculations are performed by taking the engine clock from the highest DPM state and multiplying it by xx CUs per GPU. Then, multiplying that number by xx stream processors, which exist in each CU. Then, that number is multiplied by 2 FLOPS per clock for FP32. To calculate TFLOPS for FP16, 4 FLOPS per clock were used. The FP64 TFLOPS rate is calculated using 1/16th rate. External results on the NVidia Tesla P100-16 (16GB card) GPU Accelerator resulted in 18.7 TFLOPS peak half precision (FP16) and 9.3 TFLOPS peak single precision (FP32) floating-point performance. Results found at: https://images.nvidia.com/content/tesla/pdf/nvidia-tesla-p100-PCIe-datasheet.pdf. External results on the NVidia Tesla P100-SXM2 GPU Accelerator resulted in 21.2 TFLOPS peak half precision (FP16) and 10.6 TFLOPS peak single precision (FP32) floating-point performance. Results found at: http://www.nvidia.com/object/tesla-p100.html AMD has not independently tested or verified external/third party results/data and bears no responsibility for any errors or omissions therein. RIV-1

此處提供的資訊僅供參考,可能會有所變更,恕不另行通知。儘管在準備本文件時已採取一切防範措施,本文件仍可能包含不正確的技術資訊、疏漏和打字排印錯誤,AMD 不承擔任何更新或修正此資訊的責任。Advanced Micro Devices, Inc. 不為本文件之正確性或完整性提供聲明或擔保,亦不承擔任何責任,包括針對 AMD 硬體、軟體或本文提及之其他產品的操作或使用默示未侵權、適售性、適合特定用途。「Vega」 和「Vega10」僅為 AMD 內部的架構程式碼名稱,並非產品名稱。本文件並未授予任何智慧財產權之授權,無論默示或者受到禁止與否。條款與限制適用於購買或使用雙方簽署之合約或 AMD 標準銷售條款與條件中規定之 AMD 產品。GD-18

© 2017 Advanced Micro Devices, Inc. 版權所有。AMD、AMD 箭頭標誌、Radeon 和其組合是 Advanced Micro Devices, Inc. 的商標。OpenCL 是 Apple, Inc. 的商標,其使用已經由 Khronos 授權。其他用於此出版物的產品名稱僅適用於辨識,且可能是其個別公司的商標。