صحيفة الاتحاد الإماراتية | كيف نقيس ذكاء الآلات؟ أداء المهام الطويلة والمعقدة يكشف الإجابة

كيف نقيس ذكاء الآلات؟ أداء المهام الطويلة والمعقدة يكشف الإجابة

صحيفة الاتحاد الإماراتية 28 أبريل 2025 15:38

ابتكر علماء طريقة جديدة لقياس مدى كفاءة أنظمة الذكاء الاصطناعي (AI)، وذلك عبر تقييم سرعة أدائها مقارنة بالبشر في تنفيذ المهام الصعبة.

وعلى الرغم من أن أنظمة الذكاء الاصطناعي تتفوق عادة على البشر في مهام التنبؤ بالنصوص والمعرفة العامة، إلا أنها تظهر فاعلية أقل عند تكليفها بمشاريع أكثر تعقيدًا، مثل تقديم المساعدة التنفيذية عن بُعد.

ولغرض قياس هذه الفجوة في الأداء بدقة، اقترحت دراسة جديدة تقييم أنظمة الذكاء الاصطناعي بناءً على مدة إنجازها للمهام مقارنة بالوقت الذي يحتاجه الإنسان للقيام بالمهمة نفسها. وقد نشر الباحثون نتائجهم عبر قاعدة بيانات الأبحاث الأولية arXiv، ومازالت في طور الدراسة. بحسب موقع livescience .

..

قياس مدة المهام

قال الباحثون "إنهم وجدوا أن قياس مدة المهام التي يمكن للنماذج إكمالها يعد وسيلة مفيدة لفهم قدرات الذكاء الاصطناعي الحالية. إذ يبدو أن وكلاء الذكاء الاصطناعي غالبًا ما يواجهون صعوبة في ربط سلسلة من الإجراءات الطويلة معًا أكثر من افتقارهم إلى المهارات أو المعرفة اللازمة لحل خطوات فردية."

وقد أظهرت نتائج الدراسة أن نماذج الذكاء الاصطناعي أتمت المهام التي تستغرق أقل من أربع دقائق بالنسبة للبشر بنسبة نجاح تقارب 100%. ولكن نسبة النجاح انخفضت بشكل حاد إلى 10% فقط للمهام التي تستغرق أكثر من أربع ساعات.

لاحظ الباحثون أن النماذج الأقدم من الذكاء الاصطناعي كان أداؤها أضعف في إنجاز المهام الطويلة مقارنة بالأنظمة الأحدث، وهو أمر كان متوقعًا. وأشارت الدراسة إلى أن طول المهام التي تستطيع نماذج الذكاء الاصطناعي العامة إكمالها بنسبة موثوقية تبلغ 50% قد تضاعف تقريبًا كل سبعة أشهر خلال السنوات الست الماضية.

حدود جديدة لقياس قدرات الذكاء الاصطناعي؟

قد يمثل هذا المعيار الجديد المحتمل خطوة مهمة لفهم مستوى الذكاء والقدرات الحقيقية لأنظمة الذكاء الاصطناعي بشكل أفضل.

قال الباحث سهراب كازيرونيان:"من غير المرجح أن يغير هذا المقياس نفسه مسار تطوير الذكاء الاصطناعي، لكنه سيساعد في تتبع مدى سرعة التقدم المحرز في أنواع معينة من المهام التي من المتوقع أن تُستخدم فيها أنظمة الذكاء الاصطناعي".

وأضاف: "قياس أداء الذكاء الاصطناعي بناءً على المدة الزمنية التي يستغرقها البشر لإنجاز مهمة معينة يُعد مقياسًا بديلاً مثيرًا للاهتمام لقياس الذكاء والقدرات العامة. أولاً: لأنه لا يوجد مقياس واحد يعبر بدقة عما نعنيه بكلمة (ذكاء). ثانيًا: لأن احتمالية تنفيذ مهمة طويلة الأمد من دون انحراف أو خطأ تصبح منخفضة للغاية. وثالثًا: لأنه يمثل مقياسًا مباشرًا لنوع المهام التي نطمح لاستخدام الذكاء الاصطناعي فيها، وهي حل المشكلات المعقدة التي يواجهها البشر. ورغم أن هذا المقياس قد لا يغطي جميع.....

لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه