أعلنت Anthropic عن Claude Opus 4.6 كإطلاق رئيسي يحسّن نموذج Opus 4 الأساسي. أُطلقت النسخة الجديدة مع نافذة سياق تصل إلى مليون رمز، وهو ما يسمح بمعالجة كميات كبيرة من البيانات مع الحفاظ على الأداء خلال التفاعلات الطويلة. ركّزت الشركة على تحسين الأداء في المهام المعقدة في مجالات البرمجة والهندسة المعرفية المكثفة، مع معالجة القيود التي ظهرت في الإصدار السابق. وتظهر التحسينات نتائج ملموسة عبر قدرة النموذج على التعامل مع السياقات الطويلة دون اهتزاز في النتائج.
دعم سياق واسع وميزات جديدة تدعم Claude Opus 4.6 نافذة سياق تجريبية تصل إلى مليون رمز، وهو الأول ضمن سلسلة Opus، ما يسمح بمعالجة كميات هائلة من المعلومات مع تقليل التدهور أثناء التفاعلات الطويلة. يمثل هذا تحسنًا كبيرًا مقارنة بالحد السابق البالغ 200 ألف رمز. كما يتضمن النموذج تقنيات ضغط للسياق وتلخيص البيانات القديمة أثناء المهام الطويلة، مع وجود تفكير تكيفي يقيّم تعقيد الاستفسار ليخصص مزيدًا من التفكير عند الحاجة. تتيح الضوابط المتدرجة للجهد من منخفض إلى قصوى تحسين سرعة الاستجابة والتكلفة مع الحفاظ على جودة النتائج.
أداء وتقييمات متقدمة وفق تقييمات داخلية، سجل Claude Opus 4.6 مستويات قياسية في اختبارات مثل Terminal-Bench 2.0 ومهارات سطر الأوامر، إضافة إلى تفوق في اختبارات التفكير متعدد التخصصات مثل Humanity s Last Exam. كما يتفوق في التقييمات التفاعلية GDPval-AA على نموذج GPT-5.2 من OpenAI بنحو 144 نقطة Elo وعلى Opus 4.5 بنحو 190 نقطة، مع تركيز خاص على المهام المالية والقانونية. كما تُظهر سجلات SWE-bench Verified متوسطًا يبلغ 81.42% مع تحسين قدرات البرمجة، بينما أشار اختبار CyberGym إلى أداء قوي في الأساسيات دون الاعتماد على التفكير.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من الإمارات نيوز
