El acelerador de programación más rápido del mundo para Inteligencia artificial yAprendizaje profundo 

NOTIFICARME

El acelerador de programación más rápido del mundo para Inteligencia artificial yAprendizaje profundo

Impulsionado por la arquitectura "“Vega”"

 

64 nCU

UNIDADES DE CóMPUTO
4096 Procesadores stream
 

24.6/12.3

TFLOPS
FP16 / FP32 Performance
 

16GB

HBM2
 
 

484GB/s

ANCHO DE BANDA DE LA MEMORIA
 

RENDIMIENTO

Rendimiento incomparable de punto flotante de precisión media y única

  • Rendimiento informático pico de la GPU de 24,6 TFLOPS FP16 o 12,3 TFLOPS FP32.

     

  • Con un rendimiento informático pico de la GPU de 24,6 TFLOPS FP16 o 12,3 TFLOPS FP32 en una única placa, el acelerador de servidor Radeon Instinct MI25 proporciona un rendimiento de precisión único líder para aplicaciones de programación de aprendizaje profundo e inteligencia artificial intensiva de procesamiento. El MI25 ofrece una solución potente para la mayoría de las cargas de trabajo de informática de alto rendimiento (HPC) en paralelo. El MI25 también ofrece un precisión doble pico de 768 GFLOPS (FP64) a un 1/16 de velocidad.
  • Memoria de la GPU ECC 1 HBM2 de 16 GB con ancho de banda ultra-alto.

    Con una mejora de x2 en la velocidad de datos con respecto a generaciones anteriores, con una interfaz de memoria de 512 bit, un controlador y caché con ancho de banda alto de nueva generación y la fiabilidad de la memoria ECC; la memoria de 16 GB de la GPU HBM2 del Radeon Instinct MI25 proporciona una solución como acelerador de nivel profesional capaz de gestionar las aplicaciones más exigentes de programación de aprendizaje profundo e inteligencia artificial intensiva de datos.

  • Rendimiento informático pico de la GPU de hasta 82 GFLOPS/vatio FP16 o 41 GFLOPS/vatio FP32.

    Con un rendimiento informático pico de la GPU de hasta 82 GFLOPS/vatio FP16 o 41 GFLOPS/vatio FP32, el acelerador de servidor Radeon Instinct MI25 ofrece un rendimiento incomparable por vatio para aplicaciones de programación de aprendizaje profundo e inteligencia artificial en el centro de datos, donde el rendimiento y la eficiencia en el uso de la potencia es esencial para ROI. 2 El MI25 también ofrece el rendimiento pico de 2,5 GFLOPS/vatio del FP64.

  • 64 unidades de cómputo con 64 procesadores Stream.

    El acelerador de servidor Radeon Instinct™ MI25 cuenta con 64 unidades de cómputo, cada una con 64 procesadores Stream, para un total de 4 096 procesadores Stream, basado en la arquitectura “Vega” de nueva generación con un motor de procesamiento recién diseñado basado en nuevas y flexibles unidades de cómputo (nCU) que ofrecen 16-bit, 32-bit y 64-bit de procesamiento a frecuencias más altas para sobrealimentar las cargas de trabajo dinámicas que están surgiendo. El Radeon Instinct MI25 ofrece un rendimiento y una flexibilidad de precisión única superiores para las aplicaciones más exigentes de aprendizaje profundo e inteligencia artificial en paralelo intensiva de procesamiento, en un paquete eficiente.

CARACTERÍSTICAS

Basado en la arquitectura “Vega” de nueva generación de AMD con la memoria GPU más avanzada del mundo

  • Acelerador de servidor GPU con refrigeración pasiva basado en arquitectura “Vega” de nueva generación, que utiliza un proceso FinFET de 14 nm. El acelerador de servidor Radeon Instinct MI25, basado en la nueva arquitectura “Vega” con un proceso FinFET de 14 nm, es un acelerador de nivel profesional diseñado para densidades de procesamiento optimizadas e implementación de servidores de centros de datos. El acelerador de servidor MI25 representa la solución idónea para aplicaciones de programación intensiva de procesamiento de precisión única en aprendizaje profundo e inteligencia artificial y en otras cargas de trabajo tipo HPC, en las que el rendimiento por vatio es importante.
  • Tarjeta servidor PCIe® Gen 3 x16 GPU, ranura doble, altura completa, 300 W TDP de potencia de placa La tarjeta servidor PCIe® Gen 3 x16 GPU Radeon Instinct MI25 es una unidad con altura completa y ranura doble diseñada para adaptarse a la mayor parte de los diseños de servidor y proporcionar una solución de servidores orientada a rendimiento para implementaciones de sistema de tipo HPC, programación de aprendizaje profundo e inteligencia artificial heterogénea.
  • Memoria ECC 2 HBM2 con ancho de banda ultra-alto y hasta 484 GB/s de ancho de banda de memoria. El acelerador de servidor Radeon Instinct MI25 está diseñado con 16 GB de memoria HBM2 con un ancho de banda más alto para enfrentarse a los mayores requisitos que suponen los conjuntos de datos de los sistemas más exigentes de programación de redes neuronales de aprendizaje profundo e inteligencia artificial. Los 16 GB de memoria HBM2 ECC del acelerador MI25 también representan una solución idónea para cargas de trabajo tipo HPC intensivas de datos.
  • Virtualización de hardware SR-IOV MxGPU. El acelerador de servidor Radeon Instinct MI25 está diseñado para ofrecer compatibilidad con la tecnología de virtualización de hardware SRIOV MxGPU de AMD y afrontar una mayor capacidad y uso en el centro de datos.
  • Capacidades de manejo remoto actualizadas. El acelerador Radeon Instinct MI25 dispone de circuitos con capacidad avanzada de gestión fuera de banda para simplificar las tareas de supervisión de GPU en sistemas de gran escala. Las capacidades de gestión del MI25 ofrecen accesibilidad vía I2C, con independencia del estado de la GPU, proporcionando supervisión avanzada de un rango información de la GPU dinámica y estática, haciendo uso de estructuras de datos conforme a las especificaciones PMCI, incluyendo datos de piezas de placa, números de serie, temperatura de la GPU, potencia y otro tipo de información.

ESCENARIOS DE USO

Programación de redes neuronales de aprendizaje profundo e inteligencia artificial

Las técnicas de programación empleadas actualmente en redes neuronales para aplicaciones de aprendizaje profundo e inteligencia artificial en centros de datos se han convertido en procesos muy complejos que requieren la gestión de cantidades masivas de datos al programar estas redes para reconocer patrones dentro de dichos datos. Esto requiere grandes cantidades de distribución de computación de punto flotante en muchos núcleos que las CPU tradicionales no pueden gestionar de forma tan eficiente como las GPU. Labores que supondrían semanas de computación para las CPU, las GPU las realizan en cuestión de días. El Radeon Instinct MI25, junto con los nuevos procesadores de servidor Epyc de AMD y nuestra plataforma de software abierto ROCm, proporcionan un rendimiento superior para aplicaciones de aprendizaje profundo e inteligencia artificial.

El rendimiento superior de punto flotante pico de 24,6 TFLOPS de precisión media nativa (FP16) o de 12,3 TFLOPS de precisión única (FP32) del MI25, presente en 4 096 procesadores Stream; combinado con su Caché de ancho de banda avanzado (HBC) y controlador y 16 GB de memoria HBM2 de ancho de banda alto, ofrece a los clientes un nuevo nivel de computación, capaz de cumplir con los requisitos de los sistemas más exigentes actuales en materia de gestión eficiente de grandes cantidades de datos para la programación de estas redes complejas empleadas en aprendizaje profundo. El acelerador MI25, basado en la arquitectura “Vega” de nueva generación de AMD con la arquitectura de memoria más avanzada del mundo, está optimizada para la gestión de grandes conjuntos de datos y cuenta con amplias mejoras en relojes según rendimiento que ofrecen rendimientos de cómputo pico de GPU de hasta 82 GFLOPS por vatio de FP16 o 41 GFLOPS por vatio de FP32 para ofrecer un rendimiento por vatio sobresaliente en la implementación de programación de aprendizaje profundo e inteligencia artificial en centros de datos en los que el rendimiento y la eficiencia son obligatorios. 2

Beneficios para la programación de redes neuronales de aprendizaje profundo e inteligencia artificial:

  • Rendimiento de punto flotante FP16 y FP32 incomparable
  • Plataforma ROCm de software abierto para escala de rack de tipo HPC
  • Bibliotecas de marco de aprendizaje profundo MIOpen optimizado
  • Compatibilidad BAR amplia para comunicación interpares de la mGPU
  • Las ventajas de configuración con procesadores para servidores Epyc
  • Rendimiento y densidad de computación superiores por nodo al combinar servidores basados en procesadores AMD Epyc™ y productos basados en Radeon Instinct “Vega”
  • El control de virtualización de hardware MxGPU SR-IOV permite un mayor uso y capacidad en el centro de datos

 

Computación heterogénea HPC

La industria HPC está generando inmensas cantidades de datos no estructurados cada año y una parte de las configuraciones del sistema HPC se están remodelando para permitir que la comunidad extraiga información útil de dichos datos. Tradicionalmente, estos sistemas estaban basados en CPU, pero con el crecimiento fulminante en cantidad y tipos de datos creados, junto con la evolución de códigos más complejos, estos sistemas tradicionales no cumplen todos los requisitos de las intensivas cargas de trabajo HPC actuales. Como estos tipos de códigos cada vez son más complejos y en paralelo, ha ido aumentando el uso de sistemas de computación heterogénea con distintas combinaciones de aceleradores, incluidos los GPU y FPGA discretos. Los avances en materia de capacidad de las GPU a lo largo de la pasada década ha permitido el aprovechamiento para un número cada vez mayor de estos códigos paralelos como los empleados en las redes neurológicas de programación para el aprendizaje profundo. Científicos e investigadores de todo el mundo emplean ahora aceleradores para procesar más eficientemente códigos paralelos HPC en distintas industrias, incluyendo ciencias naturales, energía, financieras, automovilísticas y aeroespaciales, académicas, gubernamentales y de defensa.

El Radeon Instinct MI25, combinado con las nuevas CPU de servidor Epyc basado en “Zen” de AMD y nuestra revolucionaria plataforma de software abierto ROCm, proporcionan una estrategia progresiva hacia la computación heterogénea abierta a partir del metal. Las soluciones HPC de nueva generación de AMD están diseñadas para ofrecer una densidad y rendimiento de computación máximos por nodo, con la eficiencia necesaria para gestionar los códigos de uso intensivo de datos paralelos masivos actuales; así como para ofrecer una solución flexible y potente para implementaciones HPC de uso general. La plataforma de software ROCm ofrece una solución de tipo HPC escalable que ofrece controladores Linux de código completamente abierto, compiladores HCC, herramientas y librerías para permitir el control de sistemas de científicos e investigadores control hasta el propio metal. La estrategia del ecosistema abierto del Radeon Instinct admite distintas arquitecturas, incluyendo x86, Power8 y ARM, junto con tecnologías de interconexión estándares de la industria que ofrecen a los clientes la posibilidad de diseñar sistemas HPC optimizados para una nueva era de computación heterogénea que adopta la estrategia abierta de la comunidad HPC para el avance científico. 2

Ventajas principales de la computación heterogénea HPC:

  • Densidad y rendimiento de computación extraordinarios por nodo
  • Plataforma ROCm de software abierto para escala de rack de tipo HPC
  • Controladores Linux de código abierto, compilador HCC, herramientas y bibliotecas a partir del metal
  • Compatibilidad del estándar abierto de la industria de arquitecturas múltiples y tecnologías de interconexión estándares de la industria 2

Descargar la ficha técnica de Radeon Instinct™ MI25

RADEON INSTINCT™ MI25 DATASHEET

Descubre el Radeon Instinct™ serie MI

RADEON INSTINCT™ MI SERIES

Acelerador de servidor Radeon Instinct™ MI25 DETALLES

Análisis exhaustivo de las especificaciones

Unidades de cómputo64 nCU
Thermal (active/passive, #slots)Pasivo, ranura doble
Precisión media pico24.6TFLOPS
Precisión única pico12.3TFLOPS
Precisión doble pico768GFLOPS
Procesadores stream4096
Potencia típica300W
Ranuras PCI necesarias2
Tasa de datos de la memoria1.89Gbps
Velocidad de memoria945MHz
Memoria16GB
Tipo de memoriaHBM2
Interfaz de la memoria2048-bit
Ancho de banda de la memoria484GB/s
Tecnología AMD Power Tune
Memoria de código corrector de errores (ECC)
Familia de productosRadeon Instinct™
Línea de productosRadeon Instinct serie MI
ModeloMI25
PlataformasServidores
SO compatibleLinux® (64-bit)
Plataforma del softwareCompatible con el ecosistema de software ROCm
  1. El respaldo de ECC queda limitado a la memoria HBM2 y la protección ECC no se ofrece para estructuras GPU internas.
  2. Previsto respaldo para varias arquitecturas, incluyendo x86, Power8 y ARM AMD, también admiten tecnologías de interconexión actuales y se prevé su compatibilidad con futuras tecnologías de interconexión estándares de la industria, incluyendo GenZ, CCIX y OpenCAPI™. Los periodos y disponibilidad de las arquitecturas admitidas y tecnologías de interconexión estándares de la industria variarán. Diríjase al vendedor de su sistema para comprobar si su sistema tiene una arquitectura/tecnología compatible.

La información presentada en este documento tiene un propósito meramente informativo y está sujeta a cambios sin previo aviso. Aunque esta página web haya sido elaborada cuidadosamente, puede contener imprecisiones técnicas, omisiones y errores tipográficos, y AMD no tiene la obligación de actualizar o corregir de otro modo esta información. Advanced Micro Devices, Inc. no proporciona ninguna representación ni garantía con respecto a la exactitud o integridad del contenido de este documento, ni asume ninguna responsabilidad de ningún tipo, incluidas las garantías implícitas de no infracción, comerciabilidad o adecuación a un uso particular, con respecto al hardware, software u otros productos de AMD descritos en este documento. “Vega” y “Vega10” son nombres de código internos de AMD solo para la arquitectura y no nombres de producto. Nada de este documento constituye un otorgamiento de licencia de ningún derecho de propiedad intelectual implícita o por acción innegable. Los términos y limitaciones aplicables a la compra o uso de los productos de AMD se establecen en un acuerdo firmado entre las partes o en los Términos y condiciones estándar de venta de AMD. GD-18

© 2017 Advanced Micro Devices, Inc. Todos los derechos reservados. AMD, el logotipo AMD Arrow, Radeon y sus combinaciones son marcas comerciales de Advanced Micro Devices, Inc. OpenCL es una marca comercial de Apple Inc. usada con permiso de Khronos. Otros nombres de productos incluidos en esta publicación son solo para fines de identificación y pueden ser marcas comerciales de sus respectivas empresas.