أطلقت DeepSeek نموذجها الجديد DeepSeek-V4، في خطوة تعكس تحولاً ملحوظاً في سوق الذكاء الاصطناعي، إذ يجمع بين أداء متقدم يقترب من النماذج العالمية الرائدة، وكفاءة تشغيلية عالية، إلى جانب تكلفة منخفضة واعتماد نهج المصدر المفتوح الذي يتيح استخدامه وتعديله على نطاق واسع.
يعتمد النموذج على بنية الخبراء المتعددين (Mixture of Experts)، حيث يضم إصدار V4-Pro نحو 1.6 تريليون متغير، مع تفعيل 49 ملياراً فقط أثناء التشغيل، فيما يأتي إصدار V4-Flash بـ284 مليار متغير مع تفعيل 13 ملياراً. هذا التصميم يسمح بتشغيل الأجزاء المطلوبة فقط وفق طبيعة المهمة، ما يحقق كفاءة كبيرة في استهلاك الموارد دون التأثير على الأداء.
ويدعم النموذج طول سياق يصل إلى مليون رمز، ما يتيح التعامل مع كميات ضخمة من البيانات ضمن طلب واحد، مثل تحليل قواعد بيانات كاملة أو أرشيفات نصية ممتدة.
بنية هندسية متقدمة
يرتكز DeepSeek-V4 على تحسينات هندسية تشمل آلية انتباه هجينة تعمل على تقليل المعلومات غير الضرورية والتركيز على العناصر الأكثر أهمية، إلى جانب تقنيات تعزز استقرار النموذج وتسهم في تسريع التدريب.
وقد انعكس ذلك على كفاءة التشغيل، إذ تراجع استهلاك الموارد إلى نحو 27% من القدرة الحسابية و10% من الذاكرة مقارنة بالإصدار السابق، بينما يحقق إصدار Flash مستويات أعلى من الكفاءة بانخفاض الاستهلاك إلى نحو 10% و7% على التوالي.
تم تدريب النموذج على أكثر من 32 تريليون رمز من البيانات عالية الجودة، عبر عملية متعددة المراحل تشمل تدريب خبراء متخصصين ثم دمجهم في نموذج موحد، مع توفير أوضاع استدلال مختلفة توازن بين السرعة والدقة.
أداء متقدم وتكلفة منخفضة
من حيث الأداء، يحقق V4-Pro تحسناً واضحاً مقارنة بالإصدار السابق، ويقترب من مستوى النماذج المغلقة الرائدة، كما يتفوق على عدد من النماذج مفتوحة المصدر، خصوصاً في مجالات البرمجة والرياضيات.
ورغم أنه لا يزال أقل في بعض المؤشرات من نماذج مثل GPT-5.5 وClaude Opus 4.7، إلا أنه يقترب منها بشكل ملحوظ، خاصة في مهام الاستدلال المعقدة.
ويبرز عامل التكلفة كعنصر حاسم، إذ.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من صحيفة الغد الأردنية
