\nPrecio de lanzamiento<\/td>\n ?<\/td>\n $1,599<\/td>\n $1,199<\/td>\n $899<\/td>\n $1,999<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\nUna de las cosas interesantes que cuenta Nvidia en su documento t\u00e9cnico es que las GPU Ada Lovelace usan transistores de alta velocidad en rutas cr\u00edticas para aumentar las velocidades m\u00e1ximas de reloj. Como resultado, su GPU AD102 totalmente habilitada con 18 432 n\u00facleos CUDA es \u00abcapaz de funcionar a velocidades superiores a 2,5 GHz, manteniendo el mismo TGP de 450 W\u00bb. Teniendo esto en cuenta, no nos sorprende que la compa\u00f1\u00eda est\u00e9 hablando de relojes de 3.0 GHz para la GeForce RTX 4090 (con 16,384 n\u00facleos CUDA) alcanzados en sus laboratorios. A 3,0 GHz, la GeForce RTX 4090 encabezar\u00e1 absolutamente nuestra lista de las mejores tarjetas gr\u00e1ficas. <\/p>\n\n\n
\n
<\/picture><\/p>\n<\/div>\n<\/div>(Cr\u00e9dito de la imagen: Nvidia)<\/span><\/figcaption><\/figure>\nAdem\u00e1s de los relojes altos, la GPU Ada Lovelace de Nvidia tambi\u00e9n cuenta con cach\u00e9s L2 masivos que mejoran el rendimiento en cargas de trabajo intensivas (por ejemplo, trazado de rayos, seguimiento de rutas, simulaciones, etc.) y reducen los requisitos de ancho de banda de memoria. Esencialmente, las GPU Ada de Nvidia toman una p\u00e1gina del libro de RDNA 2 Infinity Cache aqu\u00ed, aunque creemos que los objetivos generales para la nueva arquitectura se establecieron mucho antes de que los productos de la serie Radeon RX 6000 de AMD debutaran en 2020. <\/p>\n\nHablando de cargas de trabajo como simulaciones, debemos se\u00f1alar que en el mundo de las supercomputadoras se realizan con n\u00fameros en formato de punto flotante de doble precisi\u00f3n (FP64) para mejorar la precisi\u00f3n de los resultados. FP64 es m\u00e1s costoso que FP32 tanto en t\u00e9rminos de rendimiento como en t\u00e9rminos de complejidad de hardware. Esta es la raz\u00f3n por la cual los gr\u00e1ficos por computadora usan formatos FP32 y muchas simulaciones de activos no cr\u00edticos tambi\u00e9n se realizan con precisi\u00f3n FP32. Mientras tanto, la GPU AD102 presenta solo 288 n\u00facleos FP64 (dos por multiprocesador de transmisi\u00f3n) incluidos para garantizar que cualquier programa con c\u00f3digo FP64 funcione correctamente, incluido el c\u00f3digo FP64 Tensor Core. <\/p>\n
A\u00fan as\u00ed, la tasa FP64 de AD102 es 1\/64 de la tasa TFLOP de las operaciones FP32 (que est\u00e1 en l\u00ednea con la arquitectura Ampere). Nvidia no muestra sus n\u00facleos FP64 en los diagramas de sus m\u00f3dulos multiprocesador (SM) de transmisi\u00f3n y no revela la cantidad de dichos n\u00facleos en las GPU AD103 y AD104. La baja tasa de FP64 de los procesadores gr\u00e1ficos Ada enfatiza que estas partes est\u00e1n destinadas principalmente a los juegos.<\/p>\n
La complejidad y los tama\u00f1os de matriz de los procesadores gr\u00e1ficos Ada Lovelace de Nvidia en comparaci\u00f3n con las GPU Ampere de la empresa no deber\u00edan sorprender. Las nuevas GPU Ada se fabrican con las tecnolog\u00edas de fabricaci\u00f3n 4N (clase 5nm) de TSMC, mientras que Ampere se fabric\u00f3 con el proceso 8LPP de Samsung Foundry (un nodo de clase 10nm con un encogimiento \u00f3ptico del 10%). Esa complejidad adicional (recuento de transistores) es lo que permite mejoras de rendimiento impresionantes en elementos como el trazado de rayos y mejoras de calidad con DLSS 3.0. <\/p>\n
\n
\n
\nEspecificaciones de Nvidia Ada frente a Ampere<\/caption>\n \n\nGPU\/tarjeta gr\u00e1fica<\/th>\n AD102<\/th>\n RTX 4090<\/th>\n RTX 4080 16GB<\/th>\n RTX 4080 12GB<\/th>\n RTX 3090 Ti<\/th>\n<\/tr>\n<\/thead>\n \n\nGPU<\/td>\n AD102<\/td>\n AD102<\/td>\n AD103<\/td>\n AD104<\/td>\n GA102<\/td>\n<\/tr>\n \nTFLOPS FP32 (impulso)<\/td>\n ?<\/td>\n 82.6<\/td>\n 48.7<\/td>\n 40.1<\/td>\n 40,0<\/td>\n<\/tr>\n \nTFLOPS FP16 (FP8)<\/td>\n ?<\/td>\n 661 (1321)<\/td>\n 390 (780)<\/td>\n 319 (639)<\/td>\n 320 (N\/D)<\/td>\n<\/tr>\n \nTrazado de rayos TFLOPS<\/td>\n ?<\/td>\n 191<\/td>\n 113<\/td>\n 82<\/td>\n 78.1<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\nOtra cosa a tener en cuenta es que la GPU AD102 de Nvidia tiene una mayor densidad de transistores que sus hermanos menores. Por un lado, esa densidad de transistores a\u00f1adida del 3,6% le permite empaquetar significativamente m\u00e1s unidades de ejecuci\u00f3n en AD102 en comparaci\u00f3n con sus hermanos m\u00e1s peque\u00f1os. Pero por otro lado, la relajada densidad de transistores de AD103 y AD104 en muchos casos permite mejores rendimientos (asumiendo que la densidad de defectos del nodo no es alta en general) y relojes m\u00e1s altos.<\/p>\n
Es dif\u00edcil hacer predicciones sobre el potencial de frecuencia de AD103 y AD104 sin acceso al hardware real y\/o conocimiento de sus tasas de rendimiento reales. Sin embargo, si el AD102 puede funcionar a 2,50 GHz ~ 3,0 GHz, entonces es razonable esperar que el AD103 y el AD104 tengan un potencial a\u00fan mayor. Tambi\u00e9n sabemos que el RTX 4080 de 12 GB usa un chip AD104 completamente habilitado que funciona a 2610 MHz, mientras que el RTX 4080 de 16 GB usa el 95 % de un chip AD103 (76 de 80 SM) que funciona a 2505 MHz, y el RTX 4090 solo usa el 89 % ( 128 de 144 SM) funcionando a 2510 MHz, tambi\u00e9n con el 25 % de la memoria cach\u00e9 L2 deshabilitada.<\/p>\n
Una cantidad extrema de unidades de ejecuci\u00f3n, habilitadas por una alta complejidad, junto con relojes altos, deber\u00edan brindar ganancias de rendimiento notables. La GeForce RTX 4090 de Nvidia tiene una tasa de c\u00f3mputo te\u00f3rica m\u00e1xima de FP32 dos veces mayor (~82,6 TFLOPS) en comparaci\u00f3n con la GeForce RTX 3090 Ti (~40 TFLOPS). <\/p>\n
Mientras tanto, la l\u00ednea actual de GPU Ada de Nvidia para jugadores exigentes muestra que la empresa ha vuelto a la normalidad con su enfoque de tres chips para el mercado de juegos de gama alta. Normalmente, Nvidia lanza su GPU insignia para juegos, le sigue un chip que tiene aproximadamente entre el 66 % y el 75 % de los recursos del buque insignia (p. ej., n\u00facleos CUDA) y luego presenta un procesador de gr\u00e1ficos que tiene alrededor del 50 % de las unidades del buque insignia. Con la familia Ampere, esa estrategia se ajust\u00f3 un poco ya que el chip GA103 de Nvidia se dise\u00f1\u00f3 principalmente con las computadoras port\u00e1tiles en mente y apenas lleg\u00f3 a las computadoras de escritorio (tambi\u00e9n lleg\u00f3 tarde a la fiesta), sin embargo, con la generaci\u00f3n Ada, Nvidia vuelve a su enfoque habitual con tres fichas <\/p>\n
M\u00e1s SKU entrantes <\/h2>\n Una conclusi\u00f3n interesante es la disparidad entre las configuraciones m\u00e1ximas que ofrece la GPU AD102 y la tarjeta gr\u00e1fica GeForce RTX 4090. AD102 incluye 18 432 n\u00facleos CUDA, mientras que la GeForce RTX 4090 viene con 16 384 n\u00facleos CUDA habilitados. Este enfoque le da a Nvidia cierta flexibilidad adicional con respecto a los rendimientos y la introducci\u00f3n de nuevas tarjetas gr\u00e1ficas en el futuro, por lo que hay mucho espacio para una generaci\u00f3n RTX 4090 Ti, RTX 4080 Ti y RTX 5500\/5000 Ada para los mercados de ProViz, etc.<\/p>\n
Mientras tanto, la GeForce RTX 4080 de 16 GB y la RTX 4080 de 12 GB utilizan GPU AD103 casi completas y AD104 completas, respectivamente. No sabemos qu\u00e9 traer\u00e1 el futuro, pero anticipamos que eventualmente veremos versiones reducidas de las GPU AD103 y AD104. Podemos especular sobre GeForce RTX 4070 Ti y\/o RTX 4070 en funci\u00f3n de los contenedores reducidos del chip AD104, as\u00ed como el potencial de soluciones gr\u00e1ficas de gama ultra alta para computadoras port\u00e1tiles con el procesador de gr\u00e1ficos AD103, pero solo podemos adivinar las especificaciones de estas partes. <\/p>\n
Algunos pensamientos <\/h2>\n La arquitectura Ada Lovelace de Nvidia es un salto tanto cualitativo como cuantitativo sobre la arquitectura Ampere. Nvidia no solo mejor\u00f3 seriamente el rendimiento de su trazado de rayos, n\u00facleos tensoriales y algunas otras unidades a nivel arquitect\u00f3nico, sino que tambi\u00e9n aument\u00f3 su n\u00famero y mejor\u00f3 sus relojes. Una mejora importante aqu\u00ed son las cach\u00e9s L2 enormemente aumentadas de las GPU Ada en comparaci\u00f3n con las GPU Ampere. <\/p>\n
En gran medida, estos avances fueron posibles gracias a la tecnolog\u00eda de proceso 4N optimizada para GPU de Nvidia de TSMC. Adem\u00e1s, la empresa tambi\u00e9n us\u00f3 transistores de alta velocidad para aumentar las frecuencias de sus nuevos procesadores gr\u00e1ficos, lo que proporcion\u00f3 ganancias de rendimiento adicionales. <\/p>\n
Pero un nodo de producci\u00f3n de vanguardia y los tama\u00f1os de matriz grandes de las nuevas GPU de Nvidia tambi\u00e9n hacen que las piezas sean significativamente m\u00e1s costosas de construir, raz\u00f3n por la cual los precios de las tarjetas gr\u00e1ficas GeForce RTX 4080 y 4090 son considerablemente m\u00e1s altos que sus predecesores directos.<\/p>\n
Hasta el momento, Nvidia ha presentado solo cinco productos basados \u200b\u200ben Ada Lovelace: tarjetas gr\u00e1ficas GeForce RTX 4080 de 12 GB, RTX 4080 de 16 GB y RTX 4090 para computadoras de escritorio, junto con la generaci\u00f3n RTX 6000 Ada para estaciones de trabajo\/centros de datos y placas L40 (Lovelace 40) para equipos de alto rendimiento. estaciones de trabajo finales y entornos de estaciones de trabajo virtualizadas. <\/p>\n
Teniendo en cuenta que la empresa puede ofrecer AD102 completo y versiones reducidas de las GPU AD102, AD103 y AD104, podemos imaginar una gran cantidad de nuevas tarjetas de la serie GeForce RTX 40 para m\u00e1quinas cliente y soluciones de la serie Ada RTX para centros de datos. Mientras tanto, Nvidia probablemente est\u00e9 preparando algunas GPU m\u00e1s peque\u00f1as (AD106, AD107), por lo que parece que la familia de productos Ada Lovelace ser\u00e1 al menos tan amplia como la l\u00ednea Ampere.<\/p>\n<\/div>\n
\nSource link-41<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"Cuando Nvidia present\u00f3 su familia de unidades de procesamiento de gr\u00e1ficos Ada Lovelace a principios de esta semana, se centr\u00f3 principalmente en su GPU AD102 de gama alta y su…<\/p>\n","protected":false},"author":1,"featured_media":188955,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[24035,4441,10692,4256,8,24036,843,49408,16592,103,3231,32699],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/188954"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=188954"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/188954\/revisions"}],"predecessor-version":[{"id":188956,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/188954\/revisions\/188956"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/188955"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=188954"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=188954"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=188954"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}