NVIDIA está desarrollando una nueva arquitectura de entrada/salida llamada SCADA (Scaled Accelerated Data Access), según informa Blocks & Files. Este enfoque innovador busca que las GPU no solo procesen datos, sino que también inicien y gestionen directamente las operaciones de acceso a los almacenamientos, eliminando así una carga significativa del procesador central. La propuesta representa una evolución más profunda respecto a tecnologías existentes como GPUDirect, apuntando a optimizar los flujos de trabajo modernos de inteligencia artificial donde la gestión eficiente de la E/S es crítica.


La evolución más allá de GPUDirect

La tecnología actual GPUDirect Storage ya permite una transferencia de datos acelerada entre las GPU y las unidades NVMe SSD, utilizando acceso directo a memoria remota (RDMA) para evitar la copia de datos a través de la memoria del CPU. Sin embargo, en este esquema, aunque la CPU no mueve físicamente los datos, sigue siendo responsable de orquestar y coordinar el proceso de transferencia. SCADA da un paso más allá al transferir también esta tarea de gestión y control a la GPU, permitiendo que el acelerador inicie y supervise sus propias operaciones de E/S sin intervención del procesador central.

Impacto en el entrenamiento e inferencia de IA

Este cambio de paradigma está motivado por las demandas específicas de las cargas de trabajo de inteligencia artificial. Durante el entrenamiento de modelos, es necesario mover grandes volúmenes de datos en ráfagas intensas, mientras que en la fase de inferencia se producen multitud de solicitudes de pequeños bloques de datos, típicamente de menos de 4 KB. En este último escenario, el tiempo y los recursos dedicados a gestionar cada una de estas numerosas transferencias se vuelve significativo. La investigación de NVIDIA ha demostrado que al permitir que la GPU inicie estas transferencias por sí misma, se reduce la latencia y se acelera notablemente el rendimiento en inferencia, lo que ha llevado al desarrollo de la arquitectura SCADA como solución integral.

Parece que la CPU, después de años de ser el centro de todo, podría estar a punto de recibir su merecido descanso... o al menos, de delegar una de sus tareas más tediosas en su colega sobrecargado de trabajo, la GPU.