Google выпустил Gemini 3.5 Flash — первую модель нового семейства, разработанную для обеспечения передового интеллекта с более высокой скоростью и менее чем за половину цены конкурентов. По данным Google DeepMind, эта модель генерирует в четыре раза больше токенов в секунду, чем другие, превосходя Gemini 3.1 Pro в ключевых тестах, таких как Terminal-Bench 2.1 и CharXiv Reasoning. Это первая модель, одновременно занимающая верхний правый квадрант индекса Artificial Analysis, сочетая высокий интеллект и скорость.
Как работает новое поколение моделей ⚡
Архитектура Gemini 3.5 Flash оптимизирует параллельную обработку, что снижает задержку и повышает производительность без потери точности. Во внутренних тестах модель демонстрирует заметные улучшения в визуальном мышлении и выполнении сложных задач в терминале. Благодаря более высокой эффективности разработчики могут запускать приложения, которые ранее требовали дорогостоящего оборудования, снижая стоимость одного запроса. Google делает ставку на демократизацию доступа к высокопроизводительным моделям, напрямую конкурируя с более медленными и дорогими решениями на рынке.
ИИ, который отвечает, прежде чем вы закончите задавать вопрос 🤯
Gemini 3.5 Flash настолько быстр, что, вероятно, уже сгенерировал ответ, прежде чем вы дочитали это предложение. Такими темпами мы скоро увидим модели, отвечающие на вопросы, которые мы ещё не задали. А пока конкуренты с завистью смотрят, как Google продаёт интеллект по бросовой цене, заставляя платить больше за меньшее количество токенов, что почти напоминает мошенничество старой школы.