गूगल ने जेमिनी ओम्नी प्रस्तुत किया है, एक मॉडल जो संवाद प्रारूप में प्राकृतिक भाषा के माध्यम से एक वीडियो को दूसरे वीडियो में बदलने की अनुमति देता है। पिछले वीओ के विपरीत, यह सिस्टम दृश्य की सुसंगति और पात्रों की क्रियाओं को बनाए रखते हुए मूल फ्रेम को संपादित करता है। वर्तमान में यह ध्वनि के साथ 10 सेकंड तक के क्लिप उत्पन्न करता है, हालांकि कंपनी पहले से ही उस सीमा को बढ़ाने की योजना बना रही है।
प्रत्येक फ्रेम में भौतिकी और ऐतिहासिक संदर्भ 🧠
यह मॉडल ऐतिहासिक और वैज्ञानिक संदर्भों पर विचार करते हुए दृश्य उत्पन्न करने के लिए जेमिनी पारिस्थितिकी तंत्र पर निर्भर करता है। यह गुरुत्वाकर्षण या द्रव गतिकी जैसी घटनाओं को सटीकता से पुन: प्रस्तुत करता है, जो उदाहरण के लिए, मध्ययुगीन लड़ाई की पृष्ठभूमि को अंतरिक्ष तूफान में बदलने की अनुमति देता है, बिना पात्रों के गुब्बारों की तरह तैरने के। इसमें सिस्टम के विशाल ज्ञान का उपयोग करके दृश्य तर्क बनाए रखने के लिए अनुकूलित डिजिटल अवतारों का निर्माण भी शामिल है।
हर यूट्यूबर का सपना: आफ्टर इफेक्ट्स खोले बिना संपादन करना 🎬
अब कोई भी सामान्य व्यक्ति कह सकेगा उस बिल्ली को नाचते हुए डायनासोर से बदल दो और वीडियो मान जाएगा। बुरी बात यह है कि यदि आप 11 सेकंड का क्लिप मांगते हैं, तो जेमिनी आपको डिजिटल तिरस्कार से देखेगा और याद दिलाएगा कि वह अभी भी बीटा चरण में है। लेकिन अरे, जब तक आप प्रतीक्षा करते हैं, आप एक ऐसा अवतार बना सकते हैं जो वे काम करे जो आप कभी नहीं करेंगे, जैसे घर की सफाई करना। मानवीय आलस्य, अंततः, अपना उपकरण पा गया है।