Versátil acelerador de programación e inferencia para aprendizaje profundo  e Inteligencia artificial

NOTIFICARME

Solución idónea de programación avanzada para aplicaciones de aprendizaje profundo e inteligencia artificial

Impulsionado por la arquitectura "“Polaris”"

 

36

UNIDADES DE CóMPUTO
2304 Procesadores stream
 

5.7

TFLOPS
FP16 and FP32Performance
 

16GB

GDDR5
 
 

224GB/s

ANCHO DE BANDA DE LA MEMORIA
 

RENDIMIENTO

5,7 TFLOPS de rendimiento de precisión media o única punta en tarjetas de ranura única utilizadas con TDP de 150 vatios

  • Rendimiento de computación pico de 5,7 TFLOPS FP16 | FP32 GPU.

    Con un rendimiento de computación pico de 5,7 TFLOPS FP16 o FP32 en una tarjeta única con 16 GB de memoria GDDR5, el acelerador de servidor Radeon Instinct MI6 ofrece un rendimiento de precisión única incomparable con gran cantidad de memoria en una tarjeta de ranura única para aplicaciones de programación avanzada e inferencia de aprendizaje profundo e inteligencia artificial, junto con una solución rentable para sistema de desarrollo HPC que precisen más memoria.

  • 16 GB de memoria GPU ultra-rápida GDDR5 en interfaz de memoria de 256-bit.

    Con 16 GB de memoria GPU GDDR5 y hasta 224 GB/s de ancho de banda de memoria, el acelerador de servidor Radeon Instinct MI6 proporciona una solución de procesamiento de precisión única, versátil y bien equilibrada para la gestión de aplicaciones exigentes de inferencia de aprendizaje profundo e inteligencia artificial, junto a una solución rentable para aplicaciones de programación avanzada gracias a su gran cantidad de memoria y bajos requisitos de potencia.

  • Rendimiento de computación de GPU pico de hasta 38 GFLOPS por vatio FP16 y FP32.

    Con un rendimiento de computación de GPU pico de hasta 38 GFLOPS/vatios FP16 o FP32, el acelerador de servidor Radeon Instinct MI6 proporciona una solución eficiente y versátil para aplicaciones de programación avanzadas e inferencias de aprendizaje profundo e inteligencia artificial.

  • 36 unidades de cómputo (2.304 procesadores Stream).

    El acelerador de servidor Radeon Instinct MI6 tiene 36 unidades de computación que contiene 64 procesadores Stream cada una, para un total de 2.304 procesadores Stream que están disponibles para la ejecución de muchos lotes más pequeños de datos simultáneamente frente a redes neuronales de aprendizaje profundo programadas para obtener resultados rápidos. El rendimiento de precisión única en una solución eficiente y de bajo coste, es crucial para estos tipos de instalaciones de sistema y el acelerador MI6 proporciona una extraordinaria precisión única en una tarjeta GPU de ranura única.

CARACTERÍSTICAS

Aceleración con refrigeración pasiva para implementaciones de servidor escalables

  • Acelerador de servidor con refrigeración pasiva basada en arquitectura “Polaris”.
    El acelerador de servidor Radeon Instinct MI6, está basado en la arquitectura “Polaris”, con un proceso FinFET de 14 nm y está diseñado para la implementación de servidores escalables de alta eficiencia para aplicaciones de programación avanzadas e interferencia de precisión única en aprendizaje profundo e inteligencia artificial, junto con sistemas de desarrollo y uso general HPC.  El acelerador de servidor GPU ofrece a los clientes una solución de computación versátil y rentable que solo consume 150 W de potencia de placa TDP.
  • Tarjeta servidor GPU de 9,5”, ranura única, 150 W de potencia de placa TDP.
    La tarjeta GPU para servidores Radeon Instinct MI6 es un tarjeta de ranura única y altura completa que funciona con placas base conforme a las especificaciones PCIe® Gen 3. La tarjeta GPU MI6 está diseñada para adaptarse a la mayoría de los diseños de servidor estándar, proporcionando una solución de servidor altamente eficiente y de bajo coste para programación avanzada e inferencia de aprendizaje profundo e inteligencia artificial heterogénea.
  • GDDR5 ultra-rápida con un ancho de banda de memoria de hasta 224GB/s.
    El acelerador de servidor Radeon Instinct MI6 está diseñado con 16 GB de memoria GDDR5 ultra-rápida que permite gestionar rápidamente numerosos lotes de datos de gran tamaño simultáneamente para atender a las exigentes aplicaciones de programación avanzada e inferencia de aprendizaje profundo e inteligencia artificial, junto con cargas de trabajo HPC.
  • Virtualización HW SRIOV MxGPU.
    El acelerador de servidor Radeon Instinct™ MI6 está diseñado para ofrecer compatibilidad con la tecnología de virtualización de hardware SRIOV MxGPU de AMD y afrontar una mayor capacidad y uso en el centro de datos.

ESCENARIOS DE USO

Inferencia para aprendizaje profundo

El crecimiento exponencial de datos actual y la naturaleza dinámica de dichos datos ha remodelado los requisitos de las configuraciones del sistema del centro de datos. Los diseñadores del centro de datos deben crear sistemas de datos con capacidad de ejecutar cargas de trabajo más complejas y paralelas por naturaleza, mientras continúan mejorando la eficiencia del sistema. Las mejoras en las capacidades de las GPU discretas y otros aceleradores a lo largo de la última década han ofrecido a los diseñadores de los centros de datos nuevas opciones para crear sistemas de computación heterogéneos que les ayudan a cumplir con nuevos retos.

La implementación de centros de datos que ejecutan aplicaciones de inferencia, en las que se ejecutan gran cantidad de nuevas entradas de conjuntos de datos más pequeños a precisión media (FP16) o precisión única (FP32) contra redes neuronales programadas para descubrir nuevos conocimientos, requieren sistemas con capacidad de computación paralela que puedan ejecutar rápidamente entradas de datos en multitud de núcleos más pequeños de forma más eficiente en lo relativo a la potencia.

El acelerador Radeon Instinct MI6 representa una solución potente, sensible a coste para implementaciones de inferencia de aprendizaje profundo e inteligencia artificial en en centros de datos que ofrecen 5,7 TFLOPS por rendimiento de punto flotante de precisión media o única en una tarjeta TDP de 150 vatios de ranura única. El acelerador MI6, basado en arquitectura “Polaris” de AMD, con 16 GB de memoria GDDR5 ultra-rápida y un ancho de banda de hasta 224 GB/s, combinado con la plataforma de software abierto ROCm de Radeon Instinct, ofrece a los diseñadores de los centros de datos una solución versátil y altamente eficiente para implementaciones de inferencia.

Ventajas clave para inferencia:

  • Rendimiento informático de precisión media o única de 5,7 TFLOPS
  • Rendimiento pico 38 GFLOPS/vatio FP16|FP32 para implementaciones de programación avanzada e inferencia eficiente
  • 358 TFLOPS de rendimiento máximo en las operaciones de cálculo de punto flotante de doble precisión
  • Rendimiento pico 2,4 GFLOPS/vatios FP64
  • 16 GB GDDR5 en interfaz de memoria de 256-bit proporciona un rendimiento de memoria ultra-rápido
  • Tarjeta GPU de ranura única y refrigeración pasiva para implementaciones de servidor escalables
  • La plataforma de software ROCm proporciona una plataforma Hyperscale de fuente abierta
  • Controladores Linux de código abierto, compilador HCC, herramientas y bibliotecas para un control completo a partir del metal
  • Bibliotecas de marco de aprendizaje profundo MIOpen optimizado
  • Compatibilidad BAR amplia para comunicación interpares de la mGPU
  • Virtualización de hardware SR-IOV MxGPU para usos de sistema optimizados

 

Programación avanzada para aprendizaje profundo

El crecimiento exponencial de datos actual y la naturaleza dinámica de dichos datos ha remodelado los requisitos de las configuraciones del sistema del centro de datos. Los diseñadores del centro de datos deben crear sistemas de datos con capacidad de ejecutar cargas de trabajo más complejas y paralelas por naturaleza, mientras continúan mejorando la eficiencia del sistema. Las mejoras en las capacidades de las GPU discretas y otros aceleradores a lo largo de la última década han ofrecido a los diseñadores de los centros de datos nuevas opciones para crear sistemas de computación heterogéneos que les ayudan a cumplir con nuevos retos.

Centros de datos que ejecutan aplicaciones de aprendizaje profundo e inteligencia artificial que utilizan implementaciones de programación avanzada, en las que los objetivos están orientados a sistema de computación eficientes y más efectivos desde el punto de vista de los costes para tareas de programación que utilizan un gran número de servidores avanzados y costes reducidos para procesar tareas de programación menos intensivas de computación, ayudando a reducir los costes generales del centro de datos alcanzando una mayor eficiencia. Estos sistemas requieren aceleradores que ofrezcan un buen rendimiento de precisión única con más cantidad de memoria en un paquete denso de baja potencia.

El Radeon Instinct MI6 es un acelerador de servidor versátil y de baja energía que se adapta perfectamente a los requisitos de la implementación de programación avanzada de bajo coste para aplicaciones de aprendizaje profundo e inteligencia artificial en centros de datos que ofrecen rendimientos de pico flotante de precisión media pico de 38 GFLOPS/vatio (FP16) o precisión única (FP32) en una tarjeta GPU TDP de 150 vatios de ranura única. El acelerador Radeon Instinct MI6, basado en la arquitectura “Polaris” d AMD, con 16 GB de memoria GDDR5 ultra-rápida y hasta 224 GB/s de ancho de banda, combinado con la estrategia del ecosistema abierto Radeon Instinct con la plataforma de software ROCm, ofrece a los diseñadores del centro de datos una solución altamente eficiente y versátil para implementaciones de programación avanzadas.

Beneficios principales de programación avanzada:

  • Rendimiento informático de precisión media o única pico de 5,7 TFLOPS
  • Rendimiento pico de 38 GFLOPS/vatio FP16|FP32 en tarjeta de ranura única
  • 358 TFLOPS de rendimiento máximo en las operaciones de cálculo de punto flotante de doble precisión
  • Rendimiento pico 2,4 GFLOPS/vatios FP64
  • 16 GB GDDR5 en interfaz de memoria de 256-bit proporciona un rendimiento de memoria ultra-rápido
  • Refrigeración pasiva para implementaciones de servidor escalables
  • La plataforma de software ROCm proporciona una plataforma Hyperscale de fuente abierta
  • Controladores Linux de código abierto, compilador HCC, herramientas y bibliotecas para un control completo a partir del metal
  • Bibliotecas de marco de aprendizaje profundo MIOpen optimizado
  • Compatibilidad BAR amplia para comunicación interpares de la mGPU
  • Virtualización de hardware SR-IOV MxGPU para uso de sistemas optimizados
  • Compatibilidad del estándar abierto de la industria de arquitecturas múltiples y tecnologías de interconexión estándares de la industria 1

 

Computación heterogénea para desarrollo y uso genera HPC

La industria HPC está generando inmensas cantidades de datos no estructurados cada año y una parte de las configuraciones del sistema HPC se están remodelando para permitir que la comunidad extraiga información útil de dichos datos. Tradicionalmente, estos sistemas estaban basados en CPU, pero con el crecimiento fulminante en cantidad y tipos de datos creados, junto con la evolución de códigos más complejos, estos sistemas tradicionales no cumplen todos los requisitos de las intensivas cargas de trabajo HPC actuales. Como estos tipos de códigos cada vez son más complejos y en paralelo, ha ido aumentando el uso de sistemas de computación heterogénea con distintas combinaciones de aceleradores, incluidos los GPU y FPGA discretos. Los avances en materia de capacidad de las GPU a lo largo de la pasada década ha permitido el aprovechamiento para un número cada vez mayor de estos códigos paralelos de precisión combinada como los empleados en aplicaciones de aprendizaje profundo. Científicos e investigadores de todo el mundo emplean ahora aceleradores para procesar más eficientemente códigos paralelos HPC en distintas industrias, incluyendo ciencias naturales, energía, financieras, automovilísticas y aeroespaciales, académicas, gubernamentales y de defensa.

El acelerador Radeon Instinct MI6, combinado con la revolucionaria plataforma de software abierto ROCm de AMD, es una solución de computación heterogénea eficiente y versátil, que ofrece 5,7 TFLOPS por cada rendimiento de precisión única o media pico en una tarjeta GPU TDP de 150 vatios y ranura única con 16 GB de memoria GDDR5 ultra-rápida y hasta 224 GB/s de ancho de banda de memoria. El acelerador Radeon Instinct MI6 representa una solución de computación heterogénea idónea para sistema de desarrollo y uso general sensible a costes empleados en servicios financieros, la industria de la energía, ciencias naturales, automovilística, académica (investigación y enseñanza), laboratorios gubernamentales y otras industrias de informática de alto rendimiento (HPC).

Ventajas clave para HPC:

  • Rendimiento informático de precisión media o única pico de 5,7 TFLOPS
  • Rendimiento informático pico de 38 GFLOPS/vatio FP16|FP32 para la gama de cargas de trabajo HPC
  • 358 TFLOPS de rendimiento máximo en las operaciones de cálculo de punto flotante de doble precisión
  • Rendimiento informático de precisión doble pico de 2,4 TFLOPS
  • 16 GB GDDR5 en interfaz de memoria de 256-bit proporciona un rendimiento de gran memoria ultra-rápido
  • Refrigeración pasiva para implementaciones de servidor escalables
  • La plataforma de software ROCm proporciona una plataforma tipo HPC
  • Controladores Linux de código abierto, compilador HCC, herramientas y bibliotecas para un control completo a partir del metal
  • Virtualización de hardware SR-IOV MxGPU para usos de sistema optimizados

Download the Radeon Instinct™ MI6 Data Sheet

Radeon Intinct™ MI6 DataSheet

Descubre el Radeon Instinct™ serie MI

RADEON INSTINCT™ MI SERIES

Acelerador de servidor Radeon Instinct™ MI6 DETALLES

Análisis exhaustivo de las especificaciones

Unidades de cómputo36
Precisión media pico5.7TFLOPS
Precisión única pico5.7TFLOPS
Precisión doble pico358GFLOPS
Procesadores stream2304
Potencia típica150W
Ranuras PCI necesarias1
Tasa de datos de la memoria7Gbps
Velocidad de memoria1750MHz
Memoria16GB
Tipo de memoriaGDDR5
Interfaz de la memoria256-bit
Ancho de banda de la memoria224GB/s
Tecnología AMD Power Tune
Familia de productosRadeon Instinct
Línea de productosRadeon Instinct serie MI
ModeloMI6
PlataformasServidores
Factor de forma y refrigeraciónAltura completa, ranura única, 9,5" de largo, refrigeración pasiva
SO compatibleLinux® (64-bit)
Plataforma del softwareCompatible con el ecosistema de software ROCm
GarantíaTres años, limitada
  1. Previsto respaldo para varias arquitecturas, incluyendo x86, Power8 y ARM AMD, también admiten tecnologías de interconexión actuales y se prevé su compatibilidad con futuras tecnologías de interconexión estándares de la industria, incluyendo GenZ, CCIX y OpenCAPI™. Los periodos y disponibilidad de las arquitecturas admitidas y tecnologías de interconexión estándares de la industria variarán. Diríjase al vendedor de su sistema para comprobar si su sistema tiene una arquitectura/tecnología compatible.

Los productos aceleradores de GPU Radeon Instinct ofrecen tres años de garantía limitada. Visite www.AMD.com/warranty para
La información presentada en este documento tiene un propósito meramente informativo y está sujeta a cambios sin previo aviso. Aunque esta página web haya sido elaborada cuidadosamente, puede contener imprecisiones técnicas, omisiones y errores tipográficos, y AMD no tiene la obligación de actualizar o corregir de otro modo esta información. Advanced Micro Devices, Inc. no proporciona ninguna representación ni garantía con respecto a la exactitud o integridad del contenido de este documento, ni asume ninguna responsabilidad de ningún tipo, incluidas las garantías implícitas de no infracción, comerciabilidad o adecuación a un uso particular, con respecto al hardware, software u otros productos de AMD descritos en este documento. “Polaris” es un nombre de código interno de AMD solo para la arquitectura y no un nombre de producto. Nada de este documento constituye un otorgamiento de licencia de ningún derecho de propiedad intelectual implícita o por acción innegable. Los términos y limitaciones aplicables a la compra o uso de los productos de AMD se establecen en un acuerdo firmado entre las partes o en los Términos y condiciones estándar de venta de AMD. GD-18

© 2017 Advanced Micro Devices, Inc. Todos los derechos reservados. AMD, el logotipo AMD Arrow, Radeon y sus combinaciones son marcas comerciales de Advanced Micro Devices, Inc. OpenCL es una marca comercial de Apple Inc. usada con permiso de Khronos. Otros nombres de productos incluidos en esta publicación son solo para fines de identificación y pueden ser marcas comerciales de sus respectivas empresas.