Google은 새로운 제품군의 첫 번째 모델인 Gemini 3.5 Flash를 출시했습니다. 이 모델은 경쟁사보다 절반도 안 되는 가격에 더 빠른 속도로 최첨단 지능을 제공하도록 설계되었습니다. Google DeepMind에 따르면, 이 모델은 다른 모델보다 초당 4배 더 많은 토큰을 생성하며 Terminal-Bench 2.1 및 CharXiv Reasoning과 같은 주요 벤치마크에서 Gemini 3.1 Pro를 능가합니다. 높은 지능과 속도를 결합하여 Artificial Analysis 지수의 오른쪽 위 사분면을 동시에 차지한 최초의 모델입니다.
새로운 모델 세대의 작동 방식 ⚡
Gemini 3.5 Flash의 아키텍처는 병렬 처리를 최적화하여 정확성을 희생하지 않으면서 지연 시간을 줄이고 처리량을 향상시킵니다. 내부 테스트에서 이 모델은 시각적 추론 및 터미널에서의 복잡한 작업 실행에서 눈에 띄는 개선을 보여줍니다. 더 효율적이기 때문에 개발자는 이전에 값비싼 하드웨어가 필요했던 애플리케이션을 실행할 수 있어 쿼리당 비용이 절감됩니다. Google은 시장의 느리고 값비싼 솔루션과 직접 경쟁하며 고성능 모델에 대한 액세스를 대중화하는 데 주력하고 있습니다.
질문을 마치기도 전에 답변하는 AI 🤯
Gemini 3.5 Flash는 너무 빨라서 아마 이 문장을 다 읽기도 전에 이미 답변을 생성했을 것입니다. 이런 추세라면 곧 우리가 아직 묻지 않은 질문에 답변하는 모델을 보게 될 것입니다. 그동안 경쟁사들은 Google이 파격적인 가격에 지능을 판매하는 것을 부러운 눈빛으로 바라보며, 더 적은 토큰에 더 많은 비용을 지불하는 것이 거의 구시대적인 사기처럼 보이게 만들고 있습니다.