Se llama Tesla T4 y es el séptimo producto de Nvidia basado en la nueva arquitectura de Turing. Después de anunciar tres tarjetas Quadro RTX para el mercado de gráficos profesionales y otras tantas soluciones de juegos GeForce RTX, aquí está una nueva propuesta diseñada para el mundo del aprendizaje automático. Fue presentado hace poco en la Conferencia de Tecnología GPU que se celebra en Japón.

La nueva solución, diseñada por Nvidia para administrar las cargas de trabajo de inferencia en centros de datos de hiperescala, reemplaza al anterior Tesla P4 basado en la arquitectura Pascal, y ofrece un rendimiento mucho mayor.

La nueva tarjeta es 5 veces más rápida que P4 en reconocimiento de voz y casi tres veces más rápida con video. Según Nvidia, la T4 también es casi 40 veces más rápida que una CPU en las solicitudes de procesamiento.

Características técnicas

El Tesla T4 está equipado con una GPU con 2560 núcleos CUDA y 320 núcleos Tensor. En el dado también deben estar espaciadas varias unidades de núcleo RT, pero probablemente no se utilizarán o, si lo desean, tendrán una tarea diferente de aquella para la que se utilizarán en las tarjetas GeForce y Quadro.

Junto al núcleo de gráficos encontramos 16 GB de memoria GDDR6 para un ancho de banda máximo de 320 G /s. La GPU admite cálculos mixtos de precisión como FP32, FP16 e INT8, pero también INT4 y en modo experimental INT1, un avance significativo en comparación con Tesla P4.

La tarjeta proporciona un rendimiento igual a 8,1 TFLOPs con cálculos FP32 (P4 se detiene en 5,5 TFLOPs), 65 TFLOPs en FP16, 130 tapas con cálculos INT8 (22 Tops para Tesla P4) y 260 tapas con los INT4.

Esta es una tarjeta de bajo perfil con disipador térmico pasivo, que consume 75 vatios y no requiere fuente de alimentación externa, es otro paso adelante en la parte frontal de eficiencia para los que trabajan con redes neuronales para procesar vídeo, imágenes y mucho más.

Tesla T4 una tarjeta gráfica con doble propósito

El Tesla T4 también puede contar con motores dedicados a la transcodificación de video completamente renovados, capaces de ofrecer el doble del rendimiento de Tesla P4. Según Nvidia, la tarjeta puede decodificar hasta 38 transmisiones de video Full HD simultáneamente.

La placa admite todos los principales marcos de la industria de aprendizaje profundo, como PyTorch, TensorFlow, MXNet y Caffee2. Nvidia también ofrece su propia TensorRT 5, una nueva versión que admite núcleos Tensor de Turing y cargas con múltiples niveles de precisión.