Googleは、新ファミリーの最初のモデルとなるGemini 3.5 Flashをリリースしました。このモデルは、競合他社の半分以下のコストで、優れた速度と最先端のインテリジェンスを提供するように設計されています。Google DeepMindによると、このモデルは他のモデルよりも1秒あたり4倍多くのトークンを生成し、Terminal-Bench 2.1やCharXiv Reasoningなどの主要ベンチマークでGemini 3.1 Proを上回っています。Artificial Analysisのインデックスにおいて、高いインテリジェンスと速度を兼ね備え、右上の象限を同時に占める初めてのモデルです。
新世代モデルの仕組み ⚡
Gemini 3.5 Flashのアーキテクチャは並列処理を最適化しており、精度を犠牲にすることなくレイテンシを削減し、スループットを向上させます。内部テストでは、このモデルは視覚的推論とターミナルでの複雑なタスク実行において顕著な改善を示しています。効率が向上したことで、開発者は以前は高価なハードウェアを必要としていたアプリケーションを実行できるようになり、クエリあたりのコストが削減されます。Googleは、市場にあるより低速で高価なソリューションと直接競合し、高性能モデルへのアクセスを民主化することを目指しています。
質問が終わる前に答えるAI 🤯
Gemini 3.5 Flashは非常に高速なため、おそらくあなたがこの文章を読み終える前に、すでに応答を生成しているでしょう。この調子でいけば、やがて私たちがまだ質問していない質問に答えるモデルが登場するのも間近です。その間、競合他社は、Googleが格安でインテリジェンスを販売し、より少ないトークンにより多くのお金を払うことがまるで旧来の詐欺のように見える様子を、羨望の眼差しで見つめています。