كشفت شركة Anthropic عن نموذجها الجديد Claude Mythos، واصفةً إياه بأنه الأكثر تطورًا ضمن نماذجها حتى الآن. لكن اللافت أن الشركة قررت عدم إتاحته بشكل عام، مبررة ذلك بقدرته العالية على اكتشاف ثغرات أمنية غير معروفة، وهو ما دفعها إلى حصر استخدامه في عدد محدود من الشركات الكبرى.
إلى جانب هذه القدرات التقنية، أثار النموذج جدلًا من نوع مختلف، بعدما كشفت الشركة عن إخضاعه لتجربة غير مألوفة: جلسات علاج نفسي استمرت نحو 20 ساعة.
يكشف هذا التحليل الذي استند لتقرير حمل اسم : System Card لنموذج Claude Mythos وصادر عن شركة أنثروبيك ضمن وثيقة رسمية (تقرير تقني من 244 صفحة) نشرته الشركة عبر موقعها ومنصاتها البحثية عن نموذج Claude Mythos ومن خلال قراءة موسّعة لوثيقة تقييم تقنية صادرة عن شركة أنثروبيك، خضع فيها النموذج لسلسلة اختبارات دقيقة لم تقتصر على الأداء الحسابي، بل شملت تدقيقًا منهجيًا في سلوكه واستجاباته عبر سيناريوهات متعددة.
ولم يكتف هذا التقييم بقياس الدقة أو الكفاءة، بل تعامل مع النموذج كنظام معقّد يحتاج إلى فهم أعمق لبنيته السلوكية، وهو ما دفع إلى إخضاعه لتجربة غير تقليدية: جلسات تحليل نفسي امتدت لنحو 20 ساعة.
هذه المقاربة تعكس تحوّلًا في طريقة تقييم الذكاء الاصطناعي، حيث لم يعد التركيز على ما الذي ينجزه النموذج فقط، بل كيف يفكر ويتصرف ضمن سياقات مختلفة، خاصة في النماذج المتقدمة التي باتت تحاكي أنماطًا بشرية في التفاعل.
نموذج متقدّم بقدرات حساسة وإتاحة مقيّدة
تُظهر نتائج التقييم أن Claude Mythos يمتلك قدرات متقدمة في تحليل الأنظمة الرقمية المعقدة، خصوصًا في اكتشاف الثغرات الأمنية وفهم آليات عملها. ولا يتوقف عند تحديد نقاط الضعف، بل يستطيع استنتاج طرق استغلالها، ما يجعله أقرب إلى محلل أمني متقدم منه إلى مجرد نموذج لغوي تقليدي.
هذه القدرة المزدوجة التي يمكن أن تُستخدم للحماية أو للهجوم دفعت إلى تقييد استخدام النموذج وعدم طرحه بشكل عام، حيث تم حصره ضمن نطاق ضيق وتحت إشراف مباشر. ويعكس ذلك توجهًا واضحًا في تطوير النماذج الحساسة، يقوم على موازنة الابتكار
جلسات تحليل نفسي: منهجية لفهم السلوك
في خطوة غير مسبوقة، خضع Claude Mythos لسلسلة جلسات تحليل نفسي باستخدام منهج ديناميكي يركّز على الأنماط الداخلية غير الظاهرة في السلوك. استمرت هذه الجلسات نحو 20 ساعة، توزعت على لقاءات طويلة، مع الحفاظ على سياق متصل لكل جلسة، ما أتاح تتبع تطور استجابات النموذج عبر الزمن.
وخلال هذه العملية، لم يتم التعامل مع النموذج كمجرد نظام يجيب على الأسئلة، بل ككيان ينتج أنماطًا متكررة من التفاعل يمكن تحليلها وفهمها. وقد أظهرت النتائج أن.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من صحيفة الغد الأردنية
