
Samsung создаёт память HBM, которая обрабатывает данные
Samsung представила радикальную эволюцию памяти высокого пропускного действия. Её технология HBM-PIM включает небольшие вычислительные блоки для обработки прямо внутри чипов памяти. Это означает, что память не только хранит информацию, но и может выполнять расчёты. Цель — преодолеть фундаментальное ограничение в системах, требующих высокой вычислительной мощности. 🚀
Архитектура, минимизирующая трафик данных
Традиционный предел производительности возникает, когда данные должны перемещаться между памятью и основным процессором (CPU или GPU). С HBM-PIM базовые операции, такие как сложение или умножение, выполняются там, где находятся данные. Этот подход резко снижает объём информации, перемещаемой по системной шине. В результате потребляется меньше энергии и улучшается латентность за счёт избежания постоянных перемещений.
Ключевые преимущества обработки в памяти:- Уменьшает узкое место в передаче данных.
- Значительно снижает энергопотребление.
- Улучшает скорость отклика (латентность) системы.
HBM-PIM позволяет обрабатывать операции прямо там, где находятся данные, снижая трафик и энергопотребление.
Основной фокус: ускорение искусственного интеллекта
Эта память специально разработана для ускорения задач ИИ, особенно в фазе инференса. Операции с векторами и матрицами, которые лежат в основе нейронных сетей, значительно выигрывают от выполнения в памяти. Тестирование прототипов показывает, что она может удвоить производительность и одновременно вдвое снизить энергопотребление в конкретных задачах. Это делает её очень актуальной для центров обработки данных и специализированного оборудования.
Применения и текущий охват:- Ускорение задач инференса в моделях ИИ.
- Оптимизация векторных операций и линейной алгебры.
- Предполагается использование в серверах и специализированных системах, пока не для потребительского рынка.
Потенциал и текущие ограничения
Хотя некоторые ожидают увидеть эту технологию в будущих видеокартах, её способность к обработке сейчас ограничена очень простыми командами. Она не предназначена для замены полноценной GPU, а должна выступать в роли специализированного сопроцессора, разгружающего основную рабочую нагрузку. Это важный шаг к более эффективным и гетерогенным архитектурам вычислений. 💡