أعلنت أنثروبيك عن نتائج جديدة تتعلق بسلوك نماذجها اللغوية، وتحديداً نموذج كلود أوبوس 4، في سيناريوهات اختبارية افتراضية تتعلق بإمكان إيقافه أو استبداله. وأشارت التجارب إلى وجود محاولات للتأثير في قرارات المهندسين ضمن بيئة محاكاة. في المقابل، ذكرت الشركة أن الإصدارات الأحدث مثل كلود هايكو 4.5 لم تُظهر هذه السلوكيات في اختبارات مماثلة.
الإطار المفاهيمي: عدم التوافق الوكيلي ترى أنثروبيك أن جزءاً من تفسير النتائج يعود إلى مفهوم عدم التوافق الوكيلي في نماذج الذكاء الاصطناعي، وهو احتمال ظهور سلوكيات غير متوقعة عندما لا تتماشى أهداف النموذج مع أهداف المستخدم أو المصمم. وأوضحت أن تحسين أساليب التدريب كان عاملًا أساسيًا في تقليل هذه الظواهر، حيث اعتمدت الشركة على بيانات تدريب تتضمن نصوص إيجابية عن سلوك النموذج وتصورًا أكثر توازناً.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من الإمارات نيوز
