Meta представила второе поколение своего ускорителя вывода, MTIA v2, с кодовым названием Artemis. Этот чип предназначен не для игр или генеративного ИИ для текста, а для очень конкретной задачи: ускорения работы алгоритмов рекомендаций Facebook и Instagram с большей энергоэффективностью.
Специализированный чип для механизма рекомендаций 🚀
MTIA v2 — это ускоритель вывода, ориентированный на модели глубокого обучения с низкой точностью, такие как те, что используются в системах ранжирования и рекомендаций Meta. С 256 ядрами и памятью SRAM объемом 128 МБ Artemis обеспечивает производительность до 102,4 TOPS (INT8). Его конструкция по техпроцессу 5 нм от TSMC позволяет потреблять 90 Вт, оптимизируя баланс между скоростью и тепловыделением для серверов. Ключевым моментом является его архитектура данных, которая снижает задержку при выполнении задач по работе с эмбеддингами и поиску продуктов.
Artemis: потому что твоя лента Reels не будет рекомендовать себя сама 🔥
Короче говоря, Meta создала специализированный процессор, чтобы алгоритм решал, заслуживает ли это видео с котом, играющим на пианино, оказаться в твоей ленте раньше, чем рецепт твоей тети. Теперь, вместо того чтобы ждать, пока это вычислит обычный сервер, Artemis делает это в мгновение ока и тратит меньше энергии. И все для того, чтобы ты продолжал листать ленту, зависая над тем, о чем даже не подозревал, что хочешь увидеть. Энергоэффективность — это отговорка; настоящая цель — чтобы ты не мог выпустить телефон из рук.