أحدث صدمة في "وادي السيليكون".. رحلة DeepSeek من نموذج ناشئ إلى تهديد عمالقة ال AI

نموذج ذكاء اصطناعي لشركة صينية ناشئة يُحدث صدمة في وادي السيلكون، ويثير مخاوف الأسواق بشأن انفجار فقاعة الـ AI.. ما هو DeepSeek، ولماذا يثير كل ذلك الزخم؟

الشركة غير المعروفة نسبياً على نطاق واسع مقارنة بنظيراتها من الشركات الأميركية العاملة بالقطاع، والتي تأسست في مايو/ آيار من العام 2023، وأطلقت أخيراً نماذج ذكاء اصطناعي متطورة بكفاءة عالية وتكلفة محدودة مقارنة بالاستثمارات التي تضخها الشركات الأميركية الأخرى، مع تقديم تلك النماذج كموارد مفتوحة المصدر.

تتحدى نماذج الشركة -التي تأسست على يد ليانغ وينفينغ، وهو مستثمر بارز في صناعتي صناديق التحوط والـ AI، وتعمل بشكل مستقل لكنها ممولة من قبل صندوق وينفينغ High-Flyer - لاعبين رئيسيين وعلى رأسهم OpenAI و Google وMeta.

نموذج التمويل المذكور يصفه تقرير لـ "فوربس" بأنه سمح للشركة بملاحقة مشاريع الذكاء الاصطناعي الطموحة دون ضغوط المستثمرين الخارجيين"، الأمر الذي مكنهم من إعطاء الأولوية للبحث والتطوير على المدى الطويل.

أما فريق الشركة، فيتألف في الأساس من مجموعة من الموهوبين من الخريجين الشباب في جامعات صينية، حيث تعطي ممارسات التوظيف في الشركة الأولوية للقدرات الفنية على الخبرة العملية التقليدية.

بداية الرحلة

بدأت رحلة DeepSeek بإصدار DeepSeek Coder بعد أشهر قليلة من تأسيسها، وتحديداً في شهر نوفمبر/ تشرين الثاني من العام 2023، وهو نموذج مفتوح المصدر مصمم لمهام الترميز.

ثم بعد ذلك أطلقت الشركة نموذجها DeepSeek LLM، وهو نموذج يستهدف التنافس مع نماذج اللغات الكبيرة الأخرى.

وفي مايو/ آيار من العام الماضي أطلقت الشركة نموذجها DeepSeek-V2 والذي اكتسب اهتماماً واسعاً بأدائه القوي وتكلفته المنخفضة، الأمر الذي أدى إلى حرب أسعار في سوق نماذج الـ AI الصينية، الأمر الذي دفع شركات مثل ByteDance وTencent وBaidu وAlibaba، إلى خفض أسعار نماذج الذكاء الاصطناعي الخاصة بها لتظل قادرة على المنافسة.

:

لاحقاً تم استبدال DeepSeek-V2 بـ DeepSeek-Coder-V2 وهو نموذج أكثر تقدماً يحتوي على 236 مليار متغير. وقد تم تصميمه لمهام وتحديات الترميز المعقدة، ويتميز بطول سياق مرتفع يصل إلى 128 ألف رمز. ويتوفر هذا النموذج من خلال واجهة برمجة تطبيقات فعالة من حيث التكلفة، بسعر 0.14 دولاراً لكل مليون رمز إدخال و0.28 دولارًا لكل مليون رمز إخراج.

وفي سياق رحلة الشركة، فإن النماذج الأحدث (DeepSeek-V3 وDeepSeek-R1) عززت بشكل أكبر مكانتها كقوة مؤثرة في السوق.

يتميز DeepSeek-V3، وهو نموذج يحتوي على 671 مليار معامل، بأداء قوي في مجموعة متنوعة من المعايير، مع استهلاك موارد أقل بشكل ملحوظ مقارنة بنظرائه. أما DeepSeek-R1، الذي تم إطلاقه الشهر الجاري، فيركز على مهام الاستدلال ويشكل تحدياً لنموذج OpenAI o1 بفضل قدراته المتقدمة.

تقدم DeepSeek أيضًا مجموعة من النماذج المُقطّرة، المعروفة باسم DeepSeek-R1-Distill، والمستندة إلى نماذج مفتوحة المصدر شائعة مثل Llama وQwen، والتي تم تحسينها باستخدام بيانات اصطناعية تم إنشاؤها بواسطة R1. توفر هذه النماذج المُقطّرة مستويات متنوعة من الأداء والكفاءة لتلبية احتياجات الحوسبة المختلفة وتوافقها مع تكوينات الأجهزة المتعددة.

ويشير تقرير "فوربس" إلى أنه رغم أن DeepSeek حققت نجاحاً ملحوظاً خلال فترة قصيرة، فمن المهم ملاحظة أن الشركة تركز في المقام الأول على الأبحاث وليس لديها خطط مفصلة للتسويق على نطاق واسع في المستقبل القريب.

في الأسبوع الماضي، أطلقت DeepSeek نموذجاً مفتوح المصدر للذكاء الاصطناعي تفوق، وفقاً للتقارير، على نموذج OpenAI في عدة اختبارات.

وذكرت الشركة أنها طورت النموذج بتكلفة تقل عن 6 ملايين دولار، رغم شكوك وول ستريت حول هذا الرقم. ومع ذلك، يثير هذا الأمر مخاوف بشأن الاستثمارات الضخمة في بناء نماذج الذكاء الاصطناعي الكبيرة، إذ قد تُنفّذ بتكلفة أقل بكثير.

وفي مجموعة من اختبارات الأداء التي أجراها طرف ثالث، تفوق نموذج DeepSeek على نموذج Meta Llama 3.1، وOpenAI GPT-4، وAnthropic Claude Sonnet 3.5 من حيث الدقة، بدءاً من حل المشكلات المعقدة.....

لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه


هذا المحتوى مقدم من قناة CNBC عربية

إقرأ على الموقع الرسمي


المزيد من قناة CNBC عربية

منذ 5 ساعات
منذ 3 ساعات
منذ 4 ساعات
منذ 9 ساعات
منذ 5 ساعات
منذ 9 ساعات
قناة CNBC عربية منذ 16 ساعة
اقتصاد الشرق مع Bloomberg منذ 7 ساعات
قناة CNBC عربية منذ 16 ساعة
قناة CNBC عربية منذ 18 ساعة
اقتصاد الشرق مع Bloomberg منذ 12 ساعة
صحيفة الاقتصادية منذ 4 ساعات
قناة CNBC عربية منذ 15 ساعة
منصة CNN الاقتصادية منذ 14 ساعة