Google ha lanciato Gemini 3.5 Flash, il primo modello della sua nuova famiglia, progettato per offrire intelligenza di frontiera a una velocità superiore e per meno della metà del prezzo dei suoi rivali. Secondo Google DeepMind, questo modello produce quattro volte più token al secondo rispetto ad altri, superando Gemini 3.1 Pro nei benchmark chiave come Terminal-Bench 2.1 e CharXiv Reasoning. È il primo a occupare simultaneamente il quadrante superiore destro dell'indice di Artificial Analysis, combinando alta intelligenza e velocità.
Così funziona la nuova generazione di modelli ⚡
L'architettura di Gemini 3.5 Flash ottimizza l'elaborazione parallela, riducendo la latenza e aumentando le prestazioni senza sacrificare la precisione. Nei test interni, il modello mostra notevoli miglioramenti nel ragionamento visivo e nell'esecuzione di compiti complessi nel terminale. Essendo più efficiente, consente agli sviluppatori di eseguire applicazioni che prima richiedevano hardware costoso, abbassando il costo per richiesta. Google punta a democratizzare l'accesso a modelli ad alte prestazioni, competendo direttamente con soluzioni più lente e costose sul mercato.
L'IA che risponde prima che tu finisca di chiedere 🤯
Gemini 3.5 Flash è così veloce che probabilmente ha già generato una risposta prima che tu finisca di leggere questa frase. A questo passo, presto vedremo modelli che rispondono a domande che non abbiamo ancora posto. Nel frattempo, i rivali guardano con invidia come Google vende intelligenza a prezzo scontato, facendo sembrare pagare di più per meno token quasi una truffa della vecchia scuola.