Google ha lanzado Gemini 3.5 Flash, el primer modelo de su nueva familia, diseñado para ofrecer inteligencia de frontera a una velocidad superior y por menos de la mitad del precio de sus rivales. Según Google DeepMind, este modelo produce cuatro veces más tokens por segundo que otros, superando a Gemini 3.1 Pro en benchmarks clave como Terminal-Bench 2.1 y CharXiv Reasoning. Es el primero en ocupar simultáneamente el cuadrante superior derecho del índice de Artificial Analysis, combinando alta inteligencia y velocidad.
Así funciona la nueva generación de modelos ⚡
La arquitectura de Gemini 3.5 Flash optimiza el procesamiento paralelo, lo que reduce la latencia y aumenta el rendimiento sin sacrificar precisión. En pruebas internas, el modelo muestra mejoras notables en razonamiento visual y ejecución de tareas complejas en terminal. Al ser más eficiente, permite a los desarrolladores ejecutar aplicaciones que antes requerían hardware costoso, abaratando el coste por consulta. Google apuesta por democratizar el acceso a modelos de alto rendimiento, compitiendo directamente con soluciones más lentas y caras del mercado.
La IA que responde antes de que termines de preguntar 🤯
Gemini 3.5 Flash es tan rápido que probablemente ya ha generado una respuesta antes de que termines de leer esta frase. A este paso, pronto veremos modelos que responden preguntas que aún no hemos planteado. Mientras tanto, los rivales miran con envidia cómo Google vende inteligencia a precio de saldo, haciendo que pagar más por menos tokens parezca casi una estafa de la vieja escuela.