Гонка за эффективностью в ИИ получила нового претендента. Компания Etched представила Sohu — чип ASIC, разработанный с нуля исключительно для выполнения моделей Transformer, таких как Llama или GPT. Забудьте о GPU общего назначения; эта специализированная интегральная схема обещает ускорить инференс до скоростей, оставляющих позади любое обычное оборудование.
Фиксированная архитектура против гибкости: необходимая жертва 🎯
В отличие от GPU, которые справляются с любой графической или вычислительной нагрузкой, Sohu — это функциональный монолит. Его схемотехника оптимизирована до миллиметра для ключевых операций Transformer: внимания, проекций и прямосвязных слоев. Устраняя издержки общей программируемости, он достигает гораздо более высокой производительности на ватт. Недостаток очевиден: если завтра появится другая архитектура ИИ, чип устареет.
Драма обладания Ferrari, который умеет ездить только по прямой 🏎️
Представьте, что вы купили гоночный автомобиль, который очень быстр, но работает только на прямой платной трассе. Это и есть Sohu. В то время как GPU подобны фургону, который везет всё, этот ASIC — болид Формулы-1, который застревает на первом же перекрестке. Если вы компания, которая живет и умирает за Llama, это ваш козырь в рукаве. Остальным придется подождать, пока рынок решит, окупается ли специализация.