"أوبن إيه آي" تطلق "GPT-5.3 إنستانت" مع خفض "الهلوسة" 27%

إنشاء ملخص باستخدام الذكاء الاصطناعي الخلاصة أعلنت شركة أوبن إيه آي عن إطلاق تحديث "GPT-5.3 إنستانت" لنموذج تشات جي بي تي، خفض ظاهرة الهلوسة بنسبة 26.8%، مع تحسين دقة الإجابات وتجربة الحوار. النموذج متاح حالياً للمستخدمين والمطورين، وتعمل الشركة على تحديث نماذج أخرى. أظهرت اختبارات السلامة أداءً جيداً مع بعض التراجع في فئات محددة. إصدار "GPT-5.4" قريب. جارٍ إنشاء ملخص للمقال...

أعلنت شركة "أوبن إيه آي" إطلاق تحديث جديد لنموذج "تشات جي بي تي" تحت اسم "GPT-5.3 إنستانت"، مع تحسينات تستهدف تقليل ظاهرة "الهلوسة" التي تؤدي إلى تقديم معلومات غير دقيقة أو غير موجودة.

الشركة أفصحت أن النموذج الجديد خفض هذه الظاهرة بنسبة تصل إلى 26.8% مقارنةً بالإصدار السابق، وفق تقييمات داخلية لقياس دقة الإجابات.

وأصبح "GPT-5.3 إنستانت" النموذج الافتراضي حالياً داخل "تشات جي بي تي" والأكثر استخداماً بين المستخدمين، كما أصبح متاحاً للمطورين عبر واجهات البرمجة.

وأوضحت الشركة أن التحديث الحالي يشمل نموذج "إنستانت" فقط، بينما تعمل على تحديث نماذج أخرى داخل المنصة، منها "ثينكينغ" و"برو"، إلى الإصدار 5.3 خلال الفترة المقبلة.

نتائج التقييمات وتحسن الدقة أجرت "أوبن إيه آي" تقييمين داخليين لقياس أداء النموذج بعد التحديث. ركز التقييم الأول على مجالات الطب والتمويل والقانون التي تتطلب دقة مرتفعة بسبب تأثير المعلومات غير الصحيحة.

اعتمد التقييم الثاني على تحليل ملاحظات المستخدمين أثناء استخدام النموذج في مهامهم اليومية.

أظهرت النتائج أن "GPT-5.3 إنستانت" خفض الهلوسة بنسبة 26.8% عند استخدام البحث عبر الإنترنت كمصدر للمعلومات، كما تحسنت موثوقية الإجابات بنسبة 19.7% عند اعتماد النموذج على المعرفة الداخلية التي تدرب عليها.

وفي التقييمات المبنية على ملاحظات المستخدمين، انخفضت نسبة الهلوسة بنحو 22.5% عندما يقدم النموذج إجابات تعتمد على البحث في الويب.

تحسين تجربة الحوار الشركة ذكرت أن التحديث يتضمن تعديلات على أسلوب الحوار داخل "تشات جي بي تي"، بما يجعل الإجابات أكثر مباشرة وارتباطاً بالسؤال.

وأفادت "أوبن إيه آي" إن النماذج السابقة كانت أحياناً تستخدم نبرة تبدو متحفظة أو تفترض نية المستخدم مسبقاً، وهو ما كان يؤثر على تجربة الاستخدام.

أضافت أن الإصدار الجديد يقلل من حالات رفض الإجابة عن أسئلة لا.....

لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه


هذا المحتوى مقدم من اقتصاد الشرق مع Bloomberg

إقرأ على الموقع الرسمي


المزيد من اقتصاد الشرق مع Bloomberg

منذ 11 ساعة
منذ 7 ساعات
منذ 9 ساعات
منذ 7 ساعات
منذ 8 ساعات
منذ 8 ساعات
اقتصاد الشرق مع Bloomberg منذ 16 ساعة
اقتصاد الشرق مع Bloomberg منذ 42 دقيقة
قناة CNBC عربية منذ 8 ساعات
قناة CNBC عربية منذ 15 ساعة
قناة CNBC عربية منذ 5 ساعات
قناة CNBC عربية منذ 16 ساعة
اقتصاد الشرق مع Bloomberg منذ 12 ساعة
قناة CNBC عربية منذ 8 ساعات