Metaは、第2世代の推論アクセラレータ「MTIA v2」(コードネーム:Artemis)を発表しました。このチップは、ゲームやテキスト生成AI向けではなく、非常に具体的なタスク、つまりFacebookやInstagramのレコメンデーションアルゴリズムをより高速かつエネルギー効率よく動作させるために設計されています。
レコメンデーションエンジン専用チップ 🚀
MTIA v2は、Metaのランキングシステムやレコメンデーションシステムで使用されるような、低精度のディープラーニングモデルに特化した推論アクセラレータです。256コアと128MBのSRAMメモリを搭載し、Artemisは最大102.4 TOPS(INT8)のパフォーマンスを提供します。TSMCの5nmプロセスで設計されており、消費電力は90Wで、サーバー向けに速度と発熱のバランスを最適化しています。鍵となるのはそのデータアーキテクチャであり、埋め込みや商品検索タスクにおけるレイテンシを削減します。
Artemis:あなたのReelsフィードは自分ではおすすめしてくれないから 🔥
つまり、Metaはアルゴリズムが、あなたのフィードであなたの叔母のレシピよりも先に、ピアノを弾く猫の動画を表示する価値があるかどうかを判断するための専用プロセッサを製造したのです。以前は汎用サーバーが計算するのを待つ必要がありましたが、Artemisはそれを瞬時に行い、消費電力も少なくて済みます。すべては、あなたが自分でも見たかったとは知らなかったものを見ながら、スクロールに釘付けになるようにするためです。エネルギー効率は口実であり、本当の目標はあなたがスマートフォンを手放せなくすることです。