Gemini drei Komma fünf Flash: schnelle und günstige Intelligenz für Entwickler

Google hat Gemini 3.5 Flash veröffentlicht, das erste Modell seiner neuen Familie, das darauf ausgelegt ist, Grenzintelligenz mit überlegener Geschwindigkeit zu weniger als der Hälfte des Preises seiner Konkurrenten zu bieten. Laut Google DeepMind produziert dieses Modell viermal mehr Tokens pro Sekunde als andere und übertrifft Gemini 3.1 Pro in wichtigen Benchmarks wie Terminal-Bench 2.1 und CharXiv Reasoning. Es ist das erste, das gleichzeitig den oberen rechten Quadranten des Artificial Analysis Index belegt und dabei hohe Intelligenz und Geschwindigkeit kombiniert.

photorealistische technische Illustration eines leuchtend blauen neuronalen Netzwerkprozessorchips, der von Roboterarmen in einem Reinraum montiert wird, der Chip emittiert schnelle, pulsierende Lichtspuren, die eine viermal schnellere Tokenerzeugung darstellen, schwebende holografische Benchmark-Diagramme mit Terminal-Bench 2.1- und CharXiv Reasoning-Ergebnissen, Preisschild-Symbole mit Durchstreichungen, die die halbierten Kosten anzeigen, der Chip befindet sich im oberen rechten Quadranten eines leuchtenden Artificial Analysis Index-Gitters, Roboterarme bewegen sich mit sichtbaren Geschwindigkeitslinien, kühle blaue und weiße Industriebeleuchtung, hochdetaillierte Leiterbahnen auf der Chipoberfläche, mikroskopische Präzisionswerkzeuge in Aktion, filmische Ingenieursvisualisierung

So funktioniert die neue Modellgeneration ⚡

Die Architektur von Gemini 3.5 Flash optimiert die Parallelverarbeitung, was die Latenz reduziert und den Durchsatz erhöht, ohne die Genauigkeit zu beeinträchtigen. In internen Tests zeigt das Modell bemerkenswerte Verbesserungen beim visuellen Denken und der Ausführung komplexer Aufgaben im Terminal. Da es effizienter ist, können Entwickler Anwendungen ausführen, die zuvor teure Hardware erforderten, was die Kosten pro Abfrage senkt. Google setzt darauf, den Zugang zu leistungsstarken Modellen zu demokratisieren und tritt damit in direkte Konkurrenz zu langsameren und teureren Lösungen auf dem Markt.

Die KI, die antwortet, bevor du fertig gefragt hast 🤯

Gemini 3.5 Flash ist so schnell, dass es wahrscheinlich bereits eine Antwort generiert hat, bevor du diesen Satz zu Ende gelesen hast. Bei diesem Tempo werden wir bald Modelle sehen, die Fragen beantworten, die wir noch gar nicht gestellt haben. Währenddessen schauen die Konkurrenten neidisch zu, wie Google Intelligenz zu Schnäppchenpreisen verkauft und es fast wie einen altmodischen Betrug erscheinen lässt, mehr für weniger Tokens zu bezahlen.