Google ने Gemini 3.5 Live Translate लॉन्च किया है, एक कृत्रिम बुद्धिमत्ता जो 70 से अधिक भाषाओं के बीच वास्तविक समय में आवाज का अनुवाद करती है। इसकी खासियत यह है कि यह केवल शब्दों को परिवर्तित नहीं करती: यह वक्ता के स्वर, लय और भावना को संरक्षित करती है। यह उपकरण वीडियो कॉल, बैठकों या यात्राओं में भाषाई बाधाओं को तोड़ने का वादा करता है।
AI स्वर और संदर्भ को कैसे संभालती है 🎙️
यह प्रणाली एक ऑडियो प्रोसेसिंग मॉडल का उपयोग करती है जो विराम, उच्चारण और आवाज़ के उतार-चढ़ाव का विश्लेषण करती है। फिर, एक सिंथेटिक आवाज़ जनरेटर मूल पैटर्न के समान पैटर्न के साथ अनुवाद को पुन: प्रस्तुत करता है। Google का दावा है कि विलंबता 2 सेकंड से कम है। इसकी कुंजी इसके तंत्रिका नेटवर्क में है, जिसे हजारों घंटों के बहुभाषी संवादों पर प्रशिक्षित किया गया है, जो एक व्यंग्यात्मक प्रश्न और एक सीधे आदेश के बीच अंतर करने में सक्षम है।
अब आप 70 भाषाओं में उतने ही कष्टप्रद लग सकेंगे 😤
अंततः आप अपने विशिष्ट शिकायती स्वर को खोए बिना जर्मन में एक टेलीऑपरेटर से बहस कर सकेंगे। या जापानी में उसी उदासीनता के साथ कॉफी मंगवा सकेंगे जैसे स्पेनिश में। AI आपके जवाब देने से पहले के नाटकीय विराम को भी संरक्षित करता है। बुरी बात: यदि आप एक दखल देने वाले सेल्समैन हैं, तो आपका चिपचिपा उत्साह भी ईमानदारी से अनुवादित होगा। उसी शिष्टाचार के साथ सभी भाषाओं में अस्वीकार किए जाने के लिए तैयार रहें।