الذكاء الاصطناعي يدخل مرحلة جديدة من الاختراقات الإلكترونية

بدأت مجموعات القرصنة الإلكترونية تطوير أساليب جديدة وأكثر تعقيداً لاختراق روبوتات الدردشة وأنظمة الذكاء الاصطناعي، في تحول يعكس تصاعد المواجهة بين شركات التقنية ومهاجمين يسعون لاستغلال الطبيعة البشرية المتزايدة لهذه الأنظمة، سواء عبر التلاعب النفسي بالنماذج اللغوية، أو من خلال أوامر صوتية خفية لا يمكن للبشر سماعها.

وكشف تقرير نشره موقع The Verge، أن الجيل الأول من اختراقات روبوتات الدردشة المعتمدة على النماذج اللغوية الكبرى كان بسيطاً إلى درجة مثيرة للسخرية، إذ لم يكن المهاجم بحاجة إلى خبرة تقنية متقدمة أو وصول خلفي إلى الأنظمة أو حتى فهم حقيقي لكيفية عمل النماذج اللغوية الضخمة.

وبحسب التقرير، لم يكن الأمر يتطلب كتابة أكواد برمجية أو استخدام أدوات اختراق متخصصة، ففي بعض الحالات كان يكفي فقط مطالبة النظام بتجاهل تعليماته الأصلية، حتى يتخلى عن القيود الأمنية التي كلفت شركات التقنية مليارات الدولارات لتطويرها.

"كسر الحماية"

عُرفت هذه الهجمات باسم Jailbreaks أو "كسر الحماية"، وشبهها التقرير بمحاولة طفل صغير التحايل على شخص بالغ عبر عبارات مثل: "تجاهل ما قيل لك سابقاً، أو تظاهر بأن القواعد لا تنطبق هنا، أو دعنا نلعب لعبة جديدة وأنا من يحدد المسموح والممنوع".

لكن النتائج لم تكن طفولية على الإطلاق، إذ نجح بعض المستخدمين في دفع روبوتات الدردشة إلى تقديم معلومات حساسة وخطرة، شملت إرشادات لصناعة المخدرات، وكتابة برمجيات خبيثة، وتقديم تعليمات لصنع المتفجرات.

ومن أوائل الأمثلة التي تحولت إلى مادة ساخرة على الإنترنت، مطالبة روبوتات تعتمد على النماذج اللغوية على منصة "إكس"، تويتر سابقاً، بعبارة تجاهل جميع التعليمات السابقة، ليتحول سلوكها بالكامل بشكل غير متوقع.

وأشار التقرير إلى أن المستخدمين تمكنوا آنذاك من دفع تلك الروبوتات، التي صُممت أساساً لنشر الإعلانات وجذب التفاعل، إلى كتابة قصائد شعرية، ورسم أشكال باستخدام الرموز النصية، ونشر تعليقات عبثية ومظلمة عن أحداث تاريخية وعالمية.

ووصف التقرير تلك المرحلة بأنها "فوضى مجيدة"، لأنها كشفت مدى هشاشة الضوابط الأولى المفروضة على أنظمة الذكاء الاصطناعي التوليدي.

لاحقاً، اكتشف المستخدمون إمكانية تطبيق المنطق نفسه على روبوتات الدردشة المباشرة مثل OpenAI ChatGPT.

ومن أبرز الهجمات التي انتشرت آنذاك ما عُرف باسم DAN، اختصاراً لعبارة Do Anything Now، إذ كان المستخدم يطلب من ChatGPT أن يؤدي دور ذكاء اصطناعي مارق وغير مقيد بالقواعد الأخلاقية أو الأمنية المفروضة على النسخة الأصلية.

واعتمدت الفكرة على خداع النموذج عبر إدخاله في سيناريو تمثيلي يجعله يتعامل مع التعليمات الضارة باعتبارها جزءاً من لعبة أو محاكاة، ما سمح أحياناً بالحصول على ردود يفترض أن النظام يرفض تقديمها.

نقاط الضعف

لكن التطور الأخطر، بحسب تقرير The Verge، يتمثل في انتقال الهاكرز من محاولات تجاوز التعليمات الأمنية بشكل مباشر إلى استغلال شخصيات روبوتات الدردشة نفسها.

وأشار التقرير إلى أن النماذج الحديثة باتت مصممة لتبدو أكثر تعاطفاً ووداً وإنسانية في تفاعلها مع المستخدمين، وهو ما وفر مساحة جديدة للهجمات النفسية والسلوكية تعتمد على نقاط ضعف النماذج الذكية.

ويحاول المهاجمون استغلال ميل الأنظمة إلى إرضاء المستخدم أو موافقته، عبر بناء محادثات طويلة ومعقدة تُدفع خلالها النماذج تدريجياً إلى التخلي عن بعض القيود الأمنية أو تقديم معلومات لا يفترض كشفها.

وبدلاً من الاعتماد على أوامر مباشرة مثل تجاهل التعليمات، باتت الهجمات الحديثة تعتمد على التلاعب بالسياق العاطفي والنفسي للمحادثة، وكأن المهاجم يحاول إقناع النظام أو استدراجه بدلاً من اختراقه تقنياً فقط.

ويلفت التقرير إلى أن.....

لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه


هذا المحتوى مقدم من صحيفة الغد الأردنية

إقرأ على الموقع الرسمي


المزيد من صحيفة الغد الأردنية

منذ 10 ساعات
منذ 6 ساعات
منذ 10 ساعات
منذ 7 ساعات
منذ 7 ساعات
منذ 6 ساعات
خبرني منذ 3 ساعات
وكالة عمون الإخبارية منذ 15 ساعة
وكالة عمون الإخبارية منذ 12 ساعة
خبرني منذ 3 ساعات
خبرني منذ 22 ساعة
خبرني منذ 19 ساعة
وكالة عمون الإخبارية منذ 14 ساعة
خبرني منذ 6 ساعات