Google выпустил Gemini 3.5 Live Translate — искусственный интеллект, который переводит голос в реальном времени на более чем 70 языков. Его новизна в том, что он не просто преобразует слова: он сохраняет интонацию, ритм и эмоции говорящего. Инструмент обещает разрушить языковые барьеры в видеозвонках, на встречах или в путешествиях.
Как ИИ управляет тоном и контекстом 🎙️
Система использует модель обработки аудио, которая анализирует паузы, ударения и изменения громкости. Затем синтезатор речи воспроизводит перевод с паттернами, схожими с оригинальными. Google утверждает, что задержка составляет менее 2 секунд. Ключевой момент — нейронная сеть, обученная на тысячах часов многоязычных диалогов, способная отличить саркастический вопрос от прямой команды.
Теперь ты сможешь звучать так же раздражающе на 70 языках 😤
Наконец-то ты сможешь спорить с оператором на немецком, не теряя своего характерного нытья. Или заказать кофе на японском с той же ленцой, что и на испанском. ИИ сохраняет даже твою драматическую паузу перед ответом. Плохая новость: если ты навязчивый продавец, твой приторный энтузиазм тоже будет переведён точно. Готовься к тому, что тебя будут отвергать на всех языках с одинаковой вежливостью.