O Google lançou o Gemini 3.5 Flash, o primeiro modelo de sua nova família, projetado para oferecer inteligência de ponta a uma velocidade superior e por menos da metade do preço de seus concorrentes. Segundo o Google DeepMind, este modelo produz quatro vezes mais tokens por segundo que outros, superando o Gemini 3.1 Pro em benchmarks-chave como Terminal-Bench 2.1 e CharXiv Reasoning. É o primeiro a ocupar simultaneamente o quadrante superior direito do índice de Artificial Analysis, combinando alta inteligência e velocidade.
Como funciona a nova geração de modelos ⚡
A arquitetura do Gemini 3.5 Flash otimiza o processamento paralelo, o que reduz a latência e aumenta o desempenho sem sacrificar a precisão. Em testes internos, o modelo mostra melhorias notáveis no raciocínio visual e na execução de tarefas complexas no terminal. Por ser mais eficiente, permite que os desenvolvedores executem aplicações que antes exigiam hardware caro, barateando o custo por consulta. O Google aposta em democratizar o acesso a modelos de alto desempenho, competindo diretamente com soluções mais lentas e caras do mercado.
A IA que responde antes de você terminar de perguntar 🤯
O Gemini 3.5 Flash é tão rápido que provavelmente já gerou uma resposta antes de você terminar de ler esta frase. Nesse ritmo, em breve veremos modelos que respondem perguntas que ainda não fizemos. Enquanto isso, os concorrentes olham com inveja como o Google vende inteligência a preço de banana, fazendo com que pagar mais por menos tokens pareça quase um golpe da velha escola.