Gemini tres punto cinco Flash: inteligência rápida e barata para desenvolvedores

O Google lançou o Gemini 3.5 Flash, o primeiro modelo de sua nova família, projetado para oferecer inteligência de ponta a uma velocidade superior e por menos da metade do preço de seus concorrentes. Segundo o Google DeepMind, este modelo produz quatro vezes mais tokens por segundo que outros, superando o Gemini 3.1 Pro em benchmarks-chave como Terminal-Bench 2.1 e CharXiv Reasoning. É o primeiro a ocupar simultaneamente o quadrante superior direito do índice de Artificial Analysis, combinando alta inteligência e velocidade.

ilustração técnica fotorrealista de um chip de processador de rede neural azul brilhante sendo montado por braços robóticos em uma sala limpa, o chip emite rastros de luz pulsante rápida representando geração de tokens quatro vezes mais rápida, gráficos de benchmark holográficos flutuantes mostrando pontuações de Terminal-Bench 2.1 e CharXiv Reasoning, ícones de etiqueta de preço com marcas de corte indicando metade do custo, o chip ocupa o quadrante superior direito de uma grade brilhante do índice de Artificial Analysis, braços robóticos se movem com linhas de velocidade visíveis, iluminação industrial azul e branca fria, traços de circuito ultra detalhados na superfície do chip, ferramentas de precisão microscópicas em ação, visualização cinematográfica de engenharia

Como funciona a nova geração de modelos ⚡

A arquitetura do Gemini 3.5 Flash otimiza o processamento paralelo, o que reduz a latência e aumenta o desempenho sem sacrificar a precisão. Em testes internos, o modelo mostra melhorias notáveis no raciocínio visual e na execução de tarefas complexas no terminal. Por ser mais eficiente, permite que os desenvolvedores executem aplicações que antes exigiam hardware caro, barateando o custo por consulta. O Google aposta em democratizar o acesso a modelos de alto desempenho, competindo diretamente com soluções mais lentas e caras do mercado.

A IA que responde antes de você terminar de perguntar 🤯

O Gemini 3.5 Flash é tão rápido que provavelmente já gerou uma resposta antes de você terminar de ler esta frase. Nesse ritmo, em breve veremos modelos que respondem perguntas que ainda não fizemos. Enquanto isso, os concorrentes olham com inveja como o Google vende inteligência a preço de banana, fazendo com que pagar mais por menos tokens pareça quase um golpe da velha escola.