أطلقت جوجل Gemini 3.5 Live Translate، وهو ذكاء اصطناعي يترجم الصوت في الوقت الفعلي بين أكثر من 70 لغة. الجديد فيه أنه لا يحول الكلمات فقط: بل يحافظ على نبرة الصوت والإيقاع والعاطفة للمتحدث. تعد هذه الأداة بكسر الحواجز اللغوية في مكالمات الفيديو والاجتماعات أو أثناء السفر.
كيف يتعامل الذكاء الاصطناعي مع النبرة والسياق 🎙️
يستخدم النظام نموذجًا لمعالجة الصوت يحلل فترات التوقف والنبرات وتغيرات مستوى الصوت. ثم يقوم مولد صوت اصطناعي بإعادة إنتاج الترجمة بأنماط مشابهة للأصلية. تدعي جوجل أن زمن الاستجابة أقل من ثانيتين. المفتاح يكمن في شبكتها العصبية المدربة على آلاف الساعات من الحوارات متعددة اللغات، القادرة على التمييز بين سؤال ساخر وأمر مباشر.
الآن ستتمكن من أن تبدو مزعجًا بنفس القدر في 70 لغة 😤
أخيرًا، ستتمكن من الجدال مع موظف خدمة عملاء باللغة الألمانية دون أن تفقد نبرة شكواك المميزة. أو طلب قهوة باليابانية بنفس الفتور الذي تستخدمه بالإسبانية. يحافظ الذكاء الاصطناعي حتى على توقفك الدرامي قبل الرد. السيء: إذا كنت بائعًا ثقيل الظل، فإن حماسك المفرط سيُترجم أيضًا بأمانة. استعد لرفضك بجميع اللغات بنفس المجاملة.