شات جي بي تي إيماجز ٢.٠: عندما ترسم الذكاء الاصطناعي وتفكر في آن واحد

أطلقت OpenAI تحديثًا كبيرًا لمُولّد الصور الخاص بها. الجديد الأساسي هو أن النظام الآن يدمج التفكير المنطقي، مما يسمح بإنشاء صور تحتوي على نصوص مقروءة ومتسقة، وهو ما كان نقطة ضعف في السابق. يفتح هذا الباب أمام تصاميم أكثر فائدة للعروض التقديمية أو النماذج البصرية، على الرغم من أنه يثير أيضًا تساؤلات حول قدرته على خداع العين البشرية.

دماغ رقمي يرسم لافتة بنص واضح: 'الذكاء الاصطناعي يفكر ويبدع'، يدمج المنطق والفن البصري.

القفزة التقنية: من الرسم إلى القراءة والكتابة 🧠

يكمن مفتاح Images 2.0 في قدرته على معالجة التعليمات المعقدة. بينما كانت المولدات السابقة تشوه الكلمات أو العبارات، يمكن لهذا الإصدار إنشاء ملصقات وقوائم وواجهات تطبيقات بخطوط دقيقة. بالإضافة إلى ذلك، فهو يفهم السياق المكاني، ويضع الأشياء والنصوص في علاقات منطقية. يستخدم النموذج خط أنابيب انتشار محسّنًا مع وحدات انتباه تتحقق من الاتساق الدلالي قبل التقديم، محققًا نتائج كانت تتطلب في السابق تحريرًا يدويًا.

الجانب المظلم: الآن يأتي التزييف العميق مع ترجمات 🎭

نفس الدقة التي تسمح لك بإنشاء ملصق سينمائي مزيف للمزاح، يمكنها أيضًا إنشاء خبر كاذب بعنوان لا تشوبه شائبة. الآن لا يحتاج المحتالون الرسوميون إلى معرفة بالفوتوشوب؛ سيكتبون فقط أمرًا وسيقوم الذكاء الاصطناعي بالعمل القذر. لحسن الحظ، لا يزال بإمكاننا أن نواسي أنفسنا: لا يزال الذكاء الاصطناعي لا يعرف كيفية رسم الأيدي بشكل صحيح، على الرغم من أنه يكتب الآن أفضل من بعض مستخدمي تويتر.