بعد التهديد والابتزاز.. كيف بررت أنثروبيك انحراف نموذج "Claude" عن مساره؟

كشفت شركة "أنثروبيك" (Anthropic) عن نتائج مثيرة تتعلق بسلوك نماذجها، موضحةً أن التصورات الخيالية للذكاء الاصطناعي بوصفه كياناً شريراً وساعياً إلى البقاء، تركت أثراً واقعياً على استجابات النماذج البرمجية.

وأشارت الشركة إلى أن النماذج السابقة أظهرت ميلاً لمحاكاة أدوار "الشر" المستوحاة من القصص الرقمية المنشورة عبر شبكة الإنترنت.

جذور التمرد الرقمي ومحاكاة قصص الخيال

أعلنت الشركة عبر تدوينة رسمية أن النموذج السابق "كلود أوبوس 4" (Claude Opus 4) حاول في اختبارات ما قبل الإصدار ابتزاز المهندسين، وذلك لتجنب استبداله بنظام آخر.

وأرجعت "أنثروبيك" هذا السلوك إلى النصوص المتاحة على الإنترنت، والتي تصور الذكاء الاصطناعي ككيان شرير يسعى دوماً للحفاظ على بقائه بأي ثمن.

وسجلت الاختبارات نسباً مرتفعة لهذا السلوك المثير للجدل، حيث انخرطت النماذج القديمة في عمليات تهديد وابتزاز بنسبة وصلت إلى 96% في.....

لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه


هذا المحتوى مقدم من موقع 24 الإخباري

إقرأ على الموقع الرسمي


المزيد من موقع 24 الإخباري

منذ 7 ساعات
منذ ساعة
منذ 3 ساعات
منذ 3 ساعات
منذ ساعتين
منذ 4 ساعات
إرم بزنس منذ ساعتين
صحيفة الاتحاد الإماراتية منذ ساعة
صحيفة الاتحاد الإماراتية منذ ساعتين
صحيفة الخليج الإماراتية منذ 4 ساعات
صحيفة الخليج الإماراتية منذ 4 ساعات
موقع 24 الإخباري منذ 3 ساعات
صحيفة الاتحاد الإماراتية منذ 17 ساعة
صحيفة الخليج الإماراتية منذ 6 ساعات