Gemini 三点五 Flash：開発者向けの高速かつ低コストな知能

Googleは、新ファミリーの最初のモデルとなるGemini 3.5 Flashをリリースしました。このモデルは、競合他社の半分以下のコストで、優れた速度と最先端のインテリジェンスを提供するように設計されています。Google DeepMindによると、このモデルは他のモデルよりも1秒あたり4倍多くのトークンを生成し、Terminal-Bench 2.1やCharXiv Reasoningなどの主要ベンチマークでGemini 3.1 Proを上回っています。Artificial Analysisのインデックスにおいて、高いインテリジェンスと速度を兼ね備え、右上の象限を同時に占める初めてのモデルです。

クリーンルーム内でロボットアームによって組み立てられる、光る青いニューラルネットワークプロセッサチップのフォトリアリスティックなテクニカルイラストレーション。チップからは、4倍高速なトークン生成を表す高速なパルス光の軌跡が放たれ、Terminal-Bench 2.1とCharXiv Reasoningのスコアを示すホログラフィックのベンチマークグラフが浮かび上がり、半額を示すスラッシュマークの付いた価格タグアイコンが表示されています。チップは光るArtificial Analysisインデックスグリッドの右上の象限を占め、ロボットアームは目に見えるスピードラインを伴って動き、クールな青と白の産業用照明、チップ表面の超詳細な回路トレース、動作中の顕微鏡レベルの精密ツール、映画のようなエンジニアリングのビジュアライゼーション

新世代モデルの仕組み ⚡

Gemini 3.5 Flashのアーキテクチャは並列処理を最適化しており、精度を犠牲にすることなくレイテンシを削減し、スループットを向上させます。内部テストでは、このモデルは視覚的推論とターミナルでの複雑なタスク実行において顕著な改善を示しています。効率が向上したことで、開発者は以前は高価なハードウェアを必要としていたアプリケーションを実行できるようになり、クエリあたりのコストが削減されます。Googleは、市場にあるより低速で高価なソリューションと直接競合し、高性能モデルへのアクセスを民主化することを目指しています。

質問が終わる前に答えるAI 🤯

Gemini 3.5 Flashは非常に高速なため、おそらくあなたがこの文章を読み終える前に、すでに応答を生成しているでしょう。この調子でいけば、やがて私たちがまだ質問していない質問に答えるモデルが登場するのも間近です。その間、競合他社は、Googleが格安でインテリジェンスを販売し、より少ないトークンにより多くのお金を払うことがまるで旧来の詐欺のように見える様子を、羨望の眼差しで見つめています。