قدمت جوجل مشروع أسترا، وهو نموذج أولي لمساعد ذكاء اصطناعي متعدد الوسائط يدمج الرؤية في الوقت الفعلي مع معالجة اللغة الطبيعية. على عكس المساعدين الحاليين، لا يستمع أسترا للأوامر فحسب، بل يراقب البيئة المحيطة من خلال كاميرا الجهاز، ويحدد الأشياء، ويتعرف على السياقات، ويستجيب بشكل فوري. هذه القفزة التقنية، التي تجمع بين نماذج الرؤية الحاسوبية ونماذج اللغة الكبيرة (LLMs)، تعد بإعادة تعريف التفاعل بين الإنسان والآلة، ولكنها تفتح أيضًا نقاشًا عاجلاً حول الخصوصية والمراقبة والاعتماد التكنولوجي.
هندسة متعددة الوسائط وزمن انتقال صفري في التفاعل 🤖
من الناحية التقنية، يعمل مشروع أسترا على بنية موحدة تعالج تدفقات مستمرة من الفيديو والصوت دون الاعتماد على أوامر منفصلة. يستخدم النظام نموذج رؤية مدربًا لتقسيم وتصنيف الأشياء في الوقت الفعلي، بينما يفسر نموذج لغة كبير من الجيل التالي السياق الدلالي للمشهد. المفتاح هو زمن الانتقال: قامت جوجل بتحسين خط الأنابيب ليكون الاستجابة فورية تقريبًا، مما يلغي التوقف النموذجي للمساعدين الحاليين. وهذا يسمح، على سبيل المثال، للمساعد بشرح تشغيل جهاز ميكانيكي بينما يقوم المستخدم بتحريكه أمام الكاميرا، أو بتحديد مشكلة في نبات منزلي وتقديم نصائح للعناية به. ومع ذلك، فإن المعالجة المستمرة للفيديو في السحابة تطرح تحديات خطيرة في عرض النطاق الترددي واستهلاك الطاقة، والتي لم توضحها جوجل بالكامل بعد لتنفيذها على الأجهزة المحمولة.
المعضلة الاجتماعية: مساعدة في كل مكان أم مراقبة غير مرئية ⚖️
ينقسم المجتمع التقني بين الحماس لفائدة أسترا والقلق من آثاره الأخلاقية. إذا كان المساعد يرى كل ما يراه المستخدم، فمن يتحكم في هذه البيانات؟ يصبح الإشراف على المحتوى الناتج عن الذكاء الاصطناعي أمرًا بالغ الأهمية: فقد يسيء النظام الذي يفسر البيئة تفسير المشاهد الخاصة أو يولد ردودًا غير مناسبة. بالإضافة إلى ذلك، فإن خطر الاعتماد التكنولوجي حقيقي. تفويض تفسير العالم المادي لذكاء اصطناعي قد يؤدي إلى تآكل المهارات البشرية الأساسية، مثل الذاكرة البصرية أو القدرة على حل المشكلات العملية. تناقش منتديات مثل هذا بالفعل ما إذا كنا بحاجة إلى حدود واضحة بين المساعدة والاستبدال المعرفي، وما إذا كان ينبغي أن تكون الشفافية في معالجة الفيديو إلزامية بموجب القانون.
كيف سيغير مشروع أسترا ديناميكيات الثقة والخصوصية في الفضاءات الرقمية من خلال تحوله إلى شاهد بصري دائم على تفاعلاتنا اليومية
(ملاحظة: تأثير ستريسيند قيد التنفيذ: كلما حظرته أكثر، زاد استخدامه، مثل الميكروسْلوب)