He cometido un error en mí anterior explicación y quisiera matizarlo para no confundir a la gente.
Si observáis
la tabla publicada por Nvidia veréis lo siguiente.
[TABLE=width: 100%]
[TR]
[TD=class: tableheader, width: 20%, bgcolor: #434242, align: center]
CARACTERÍSTICAS FUNDAMENTALES[/TD]
[TD=class: tableheader, width: 20%, bgcolor: #434242, align: center]
TEsdla K20X[/TD]
[TD=class: tableheader, width: 20%, bgcolor: #434242, align: center]
TEsdla K20[/TD]
[TD=class: tableheader, width: 20%, bgcolor: #434242, align: center]
TEsdla K10[/TD]
[/TR]
[TR]
[TD]Rendimiento de la GPGPU[/TD]
[TD=colspan: 2]1 Kepler GK110[/TD]
[TD]2 Kepler GK104s[/TD]
[/TR]
[TR]
[TD]Aplicaciones de cálculo en la GPU[/TD]
[TD=colspan: 2]Procesamiento de datos sísmicos, dinámica de fluidos computacional, CAE, cálculo financiero, física y química computacional, análisis de datos, imágenes por satélite, modelos climáticos[/TD]
[TD]Procesamiento de datos sísmicos, procesamiento de señales e imágenes, análisis de vídeo[/TD]
[/TR]
[TR]
[TD]Pico de rendimiento de operación en coma flotante de doble precisión[/TD]
[TD]1.31 Tflops[/TD]
[TD]1.17 Tflops[/TD]
[TD]190 Gigafloops
(95 Gfloops por GPU)[/TD]
[/TR]
[TR]
[TD]Pico de rendimiento de operación en coma flotante de precisión simple[/TD]
[TD]3.95 Tflops[/TD]
[TD]3.52 Tflops[/TD]
[TD]4577 Gigafloops
(2288 Gfloops por GPU)[/TD]
[/TR]
[TR]
[TD]Ancho de banda de memoria
(EC desactivada)[/TD]
[TD]250 GB/sec[/TD]
[TD]208 GB/sec[/TD]
[TD]320 GBytes/s
(160 GBytes/s por GPU)[/TD]
[/TR]
[TR]
[TD]Cantidad de memoria[/TD]
[TD]6 GB[/TD]
[TD]5 GB[/TD]
[TD]8 GB
(4 GB por GPU)[/TD]
[/TR]
[TR]
[TD]Núcleos CUDA[/TD]
[TD]2688[/TD]
[TD]2496[/TD]
[TD]3072
(1536 por GPU)[/TD]
[/TR]
[/TABLE].
La confusión por mi parte provenía del hecho de leer rápido confundiendo Tfloops con Gflops, lo sé no tengo excusa.
Si os fijáis en realidad la Tesla K10 tiene
0.19 Terafloops en cálculos de doble precisión (FP64). Pero sin embargo, tiene
4.5 Terafloops para cálculos de precisión simple (FP32). La conversión es tan sencilla como dividir el número de Gigafloops entre 1.000 para calcular los Terafloops correspondientes.
Dicho en palabras sencillas, la Tesla K10 es bastante más lenta en cálculos de coma flotante de doble precisión, pero también es más rápida qué sus compañeras en cálculos de precisión simple también denominados FP32.
Siento la confusión.