تصدرت أخبار نجاح روبوتات الذكاء الاصطناعي في اجتياز اختبار تورينغ الشهير، مما أثار جدلاً واسعًا حول قدرات الذكاء الاصطناعي.
واستندت هذه التقارير إلى دراسة حديثة أجراها باحثان من جامعة كاليفورنيا في سان دييغو، حيث تم اختبار أربعة نماذج لغوية كبيرة (LLMs) باستخدام اختبار تورينغ". والنتيجة كانت مفاجئة، حيث تم تصنيف نموذج GPT-4.5 من OpenAI على أنه غير قابل للتمييز عن الإنسان بنسبة 70% من الوقت.
ما هو اختبار تورينغ؟
يُعد اختبار تورينغ واحدًا من أشهر المعايير لقياس الذكاء الاصطناعي، وقد اقترحه عالم الرياضيات البريطاني آلان تورينغ عام 1950 في مقاله الشهير "الآلات الحاسوبية والذكاء". يهدف الاختبار إلى تحديد قدرة الآلة على محاكاة سلوك الإنسان، بحيث يتمكن المُحقق من التمييز بين الإنسان والآلة بناءً على المحادثات النصية فقط. إذا كانت الآلة قادرة على إقناع المحقق بأنها إنسان، فهذا يعني أنها قد "نجحت" في اجتياز الاختبار.
تفاصيل الدراسة
ووفقاً لموقع "the conversation" تركزت الدراسة التي أجراها كاميرون جونز وبنيامين بيرغن، والتي تم نشرها في مارس الماضي، على اختبار أربعة نماذج لغوية كبيرة: ELIZA GPT-4o، LLaMa-3.1-405B، وGPT-4.5.
تم تصميم الاختبار بحيث يتفاعل المشاركون في محادثات نصية ضمن ثمانية جولات، حيث يكون كل مشارك إما مُحققًا أو شاهدًا (إنسان أو آلة).
تتكون كل جولة من محادثة مع شخصين عبر شاشة منقسمة، بحيث يتفاعل المشاركون مع كل شخص لمدة خمس دقائق، ثم عليهم تحديد أيهما إنسان وأيهما نموذج لغوي.
مع استخدام واجهة مشابهة لتطبيقات المراسلة التقليدية، أظهرت النتائج أن GPT-4.5 تم تصنيفه على أنه إنسان بنسبة 73% من الوقت، بينما LLaMa-3.1-405B تم تصنيفه كإنسان بنسبة 56%. أما ELIZA وGPT-4o فقد نجحا في خداع المشاركين بنسبة 23% و21% على التوالي.
..
هل هذا يعني أن الذكاء الاصطناعي يملك ذكاءً بشريًا؟
رغم النتائج المثيرة، لا يعني أن اجتياز اختبار تورينغ يعني أن النموذج يمتلك "الذكاء.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من صحيفة الاتحاد الإماراتية