Google hat Gemini 3.5 Flash veröffentlicht, das erste Modell seiner neuen Familie, das darauf ausgelegt ist, Grenzintelligenz mit überlegener Geschwindigkeit zu weniger als der Hälfte des Preises seiner Konkurrenten zu bieten. Laut Google DeepMind produziert dieses Modell viermal mehr Tokens pro Sekunde als andere und übertrifft Gemini 3.1 Pro in wichtigen Benchmarks wie Terminal-Bench 2.1 und CharXiv Reasoning. Es ist das erste, das gleichzeitig den oberen rechten Quadranten des Artificial Analysis Index belegt und dabei hohe Intelligenz und Geschwindigkeit kombiniert.
So funktioniert die neue Modellgeneration ⚡
Die Architektur von Gemini 3.5 Flash optimiert die Parallelverarbeitung, was die Latenz reduziert und den Durchsatz erhöht, ohne die Genauigkeit zu beeinträchtigen. In internen Tests zeigt das Modell bemerkenswerte Verbesserungen beim visuellen Denken und der Ausführung komplexer Aufgaben im Terminal. Da es effizienter ist, können Entwickler Anwendungen ausführen, die zuvor teure Hardware erforderten, was die Kosten pro Abfrage senkt. Google setzt darauf, den Zugang zu leistungsstarken Modellen zu demokratisieren und tritt damit in direkte Konkurrenz zu langsameren und teureren Lösungen auf dem Markt.
Die KI, die antwortet, bevor du fertig gefragt hast 🤯
Gemini 3.5 Flash ist so schnell, dass es wahrscheinlich bereits eine Antwort generiert hat, bevor du diesen Satz zu Ende gelesen hast. Bei diesem Tempo werden wir bald Modelle sehen, die Fragen beantworten, die wir noch gar nicht gestellt haben. Währenddessen schauen die Konkurrenten neidisch zu, wie Google Intelligenz zu Schnäppchenpreisen verkauft und es fast wie einen altmodischen Betrug erscheinen lässt, mehr für weniger Tokens zu bezahlen.