بعد قرابة عامين من توقعات أطلقها الرئيس التنفيذي لشركة مايكروسوفت ساتيا ناديلا حول سيطرة الذكاء الاصطناعي التوليدي على "أعمال المعرفة"، لا يزال الواقع داخل مكاتب المحاماة والبنوك الاستثمارية مختلفاً تماماً، حيث يحتفظ البشر بدورهم الأساسي.
ودراسة حديثة تفسر بوضوح سبب تعثر ثورة الاستبدال الموعودة: الذكاء الاصطناعي لا يجيد التعامل مع فوضى العمل الحقيقي.
اختبار قاسٍ لنظرية الاستبدال
كشفت شركة ميركور المتخصصة في بيانات التدريب عن معيار جديد يحمل اسم APEX-Agents، وهو اختبار بعيد كل البعد عن المهام التقليدية التي تتباهى فيها نماذج الذكاء الاصطناعي بكتابة القصائد أو حل المعادلات، بحسب تقرير نشره موقع "digitaltrends" واطلعت عليه "العربية Business".
اعتمد الاختبار على طلبات واقعية من محامين ومستشارين وبنكيين، وطلب من النماذج تنفيذ مهام كاملة متعددة الخطوات، تتطلب التنقل بين أنواع مختلفة من البيانات والمصادر.
النتائج كانت صادمة: حتى أقوى النماذج المتاحة حالياً، مثل Gemini 3 Flash وGPT-5.2، لم تتمكن من تجاوز حاجز 25% من الدقة.
وجاء جيميني في الصدارة بنسبة 24%، يليه GPT-5.2 بنسبة 23%، بينما علقت بقية النماذج في نطاق أقل من ذلك بكثير.
أين يفشل الذكاء الاصطناعي؟
بحسب الرئيس التنفيذي لشركة ميركور، بريندان فودي، المشكلة لا تتعلق بقدرة النماذج الحسابية، بل بفهم السياق.
ففي بيئة العمل.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من صحيفة البلاد البحرينية
