الذكاء الاصطناعي يحل المشكلات أسرع مما نعتقد الاختبارات 🤖

يُفوق سرعة تقدم الذكاء الاصطناعي في الرياضيات القدرة البشرية على تصميم اختبارات لتقييمه. تُجعل نماذج مثل تلك الخاصة بـGoogle DeepMind المعايير القياسية قديمة في أشهر، وهو دورة تتسارع. يُولد ذلك مشكلة للعلم: كيف نقيس قدرات تتطور بشكل أسي؟ الضرورة لـطرق تقييم جديدة واضحة.

Un robot escribe ecuaciones en una pizarra a velocidad de vértigo, mientras un profesor, con tiza en mano, mira perplejo su examen ya resuelto.

دورة عُتْمَة المعايير القياسية 🔄

تُسيطر الأنظمة الحالية، المدربة على كميات هائلة من البيانات وتقنيات مثل التفكير المتسلسل، بسرعة على مجموعات مشكلات محددة. بمجرد نشر اختبار جديد، تستخدمه المجتمعة لتدريب وتهيئة النماذج، التي تتفوق عليه قريباً. يُقصر هذا العملية من عمر أي مقياس، مُجبراً الباحثين على البحث عن مشكلات ذات تعقيد هيكلي أكبر أو تتطلب قفزة مفهومية غير موجودة في بيانات التدريب.

علماء يطلبون من الذكاء الاصطناعي تقييم نفسه، من فضلك 🙏

أمام الوضع، يقترح البعض حلولاً إبداعية. الأكثر شعبية هي طلب من الذكاء الاصطناعي نفسه إنشاء امتحانات المستقبل. إنه خطة مثالية: نُفَوِّض العمل الشاق ثم نشكو من أن الأسئلة سهلة جداً عليها. الخطوة المنطقية التالية ستكون أن يصحح الذكاء الاصطناعي نفسه، يكتب الورقة البحثية ويرسلها إلى مجلة، مُحَرِّرِينا نهائياً من إزعاج التفكير.