デルは、AIによるヘビーデューティーな処理向けに設計されたサーバー、PowerEdge XE9680を発表しました。その存在意義は、最大8基の高性能GPU(人気のNVIDIA H100など)を搭載し、それらを相互接続して大規模言語モデルのトレーニングを高速化することにあります。これはゲーム用でも、隣のオフィス用でもありません。
モデルの重みを動かすアーキテクチャ 🚀
XE9680の秘密は、その冷却設計と相互接続バスにあります。8基のGPUはNVLinkを介して通信し、データ転送におけるボトルネックを排除します。各H100 GPUは80GBのHBM3メモリを搭載し、合計640GBで大規模なデータセットを処理します。シャーシは、消費電力3000W以上から発生する熱を放散するように最適化されており、通常のオフィスではブレーカーが落ちるレベルです。
電気代があなたの車より高くなるとき 💡
8基のH100を24時間365日稼働させるのは、気まぐれではなく、明確な意思表明です。上司がコーヒー代の出費を嘆いているなら、このマシンの電気代の請求書は見せない方がいいでしょう。とはいえ、3週間かけてモデルのトレーニングが終わったら、冷や汗を隠して「それはGPUのおかげだ、競合他社のプレッシャーのせいじゃない」と言えるでしょう。