موقع سفاري | تطلق GPT-5.4 بقدرات استخدام الحاسوب الأصلية وتحسينات في الاستدلال #تقنية

تطلق GPT-5.4 بقدرات استخدام الحاسوب الأصلية وتحسينات في الاستدلال #تقنية

موقع سفاري 07 مارس 2026 01:10

سفاري نت متابعات

يمثّل إطلاق GPT-5.4 أحدث خطوة لشركة OpenAI في تطوير نماذج الذكاء الاصطناعي الحدية، إذ يجمع هذا النموذج بين قدرات الاستدلال والبرمجة وسير العمل الوكيلي في نموذج واحد صدر في 12 فبراير 2026. يتوفر النموذج في ChatGPT تحت مسمى GPT-5.4 Thinking، وفي واجهة برمجة التطبيقات (API)، وفي Codex. كما أصدرت الشركة GPT-5.4 Pro للمستخدمين الذين يحتاجون إلى أقصى أداء في المهام المعقدة.

على معيار GDPval الذي يختبر الوكلاء عبر 44 مهنة، يتفوق GPT-5.4 على المتخصصين في الصناعة أو يساويهم في 83.0% من المقارنات، مقارنةً بـ 70.9% لنموذج GPT-5.2. وعلى معيار داخلي لنمذجة جداول البيانات، حقق GPT-5.4 متوسط درجة 87.3%، مقابل 68.4% لـ GPT-5.2. كما فضّل المقيّمون البشريون العروض التقديمية الصادرة عن GPT-5.4 في 68.0% من الحالات.

قالت OpenAI إن GPT-5.4 هو أكثر نماذجها دقةً حتى الآن؛ إذ تقل احتمالية كذب الادعاءات الفردية بنسبة 33%، وتقل احتمالية احتواء الردود الكاملة على أخطاء بنسبة 18%، مقارنةً بـ GPT-5.2. وقال Brendan Foody، الرئيس التنفيذي لشركة Mercor، إن النموذج يتفوق في إنشاء مخرجات طويلة الأمد كعروض الشرائح والنماذج المالية والتحليل القانوني، محققاً أداءً متميزاً بسرعة أعلى وتكلفة أقل.

يُعدّ GPT-5.4 أول نموذج للأغراض العامة من OpenAI يمتلك قدرات أصلية لاستخدام الحاسوب، مما يُمكّن وكلاء الذكاء الاصطناعي من تشغيل أجهزة الكمبيوتر وتنفيذ سير عمل معقدة عبر التطبيقات. على معيار OSWorld-Verified، حقق النموذج معدل نجاح 75.0%، متجاوزاً أداء الإنسان البالغ 72.4% وأداء GPT-5.2 البالغ 47.3%. وعلى معيار WebArena-Verified، حقق معدل نجاح 67.3%، مقارنةً بـ 65.4% لـ GPT-5.2.

يدعم النموذج ما يصل إلى مليون رمز من السياق، مما يتيح للوكلاء التخطيط والتنفيذ والتحقق من المهام عبر آفاق زمنية طويلة. وقال Dod Fraser، الرئيس التنفيذي لشركة Mainstay، إن GPT-5.4 حقق معدل نجاح 95% في المحاولة الأولى عبر نحو 30,000 بوابة ضريبية وعقارية، مع إتمام الجلسات بسرعة أعلى بثلاثة أضعاف واستخدام أقل للرموز بنسبة 70%.

يُقدّم GPT-5.4 ميزة البحث عن الأدوات (Tool Search) في واجهة برمجة التطبيقات، مما يتيح للنماذج استرداد تعريفات الأدوات عند الطلب بدلاً من تحميلها جميعاً مسبقاً. في اختبار شمل 250 مهمة من معيار MCP Atlas مع تفعيل جميع خوادم MCP الـ 36، خفّض هذا النهج إجمالي استخدام الرموز بنسبة 47% مع الحفاظ على الدقة ذاتها. وقال Wade، الرئيس التنفيذي لشركة Zapier، إن GPT-5.4 أنجز المهمة حيث.....

لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه

هذا المحتوى مقدم من موقع سفاري