谷歌发布了Gemini 3.5 Live Translate,这是一款能够实时翻译超过70种语言语音的人工智能。其创新之处在于,它不仅转换单词,还能保留说话者的语调、节奏和情感。该工具旨在打破视频通话、会议或旅行中的语言障碍。
AI如何处理语调和上下文 🎙️
该系统使用音频处理模型,分析停顿、重音和音量变化。然后,语音合成生成器以与原始模式相似的方式重现翻译。谷歌声称延迟低于2秒。关键在于其神经网络,该网络经过数千小时的多语言对话训练,能够区分讽刺性问题和直接命令。
现在你可以用70种语言同样惹人厌了 😤
终于,你可以用德语与电话客服争论,而不失去你标志性的抱怨语调。或者用日语点咖啡,带着与西班牙语一样的懒散。AI甚至能保留你回答前的戏剧性停顿。坏消息是:如果你是个烦人的推销员,你那令人腻烦的热情也会被忠实翻译。准备好用同样的礼貌在每种语言中被拒绝吧。