أطلقت شركة ميتا الشركة الأم لفيسبوك وإنستغرام، سلسلة الجيل الرابع من نماذج Llama، مع إتاحة نماذج مفتوحة المصدر للمطورين عبر منصتي Hugging Face وllama.com، في خطوة نحو عصر جديد من الابتكار في الذكاء الصناعي متعدد الوسائط.
تفاصيل السلسلة الجديدة
تتضمن سلسلة Llama 4 الجديدة 3 نماذج رئيسية، تختلف في الغرض والقوة الحسابية، وهي على النحو التالي:
نموذج Llama 4 Scout: يحتوي على 17 مليار باراميتر نشط و16 خبيرًا، ويُعد الأفضل في فئته من حيث الكفاءة والأداء، مع دعم نافذة سياق غير مسبوقة تصل إلى 10 ملايين رمز.
نموذج Llama 4 Maverick: يعتمد على نفس عدد الباراميترات النشطة ولكن مع 128 خبيرًا، ويتفوق على GPT-4o وGemini 2.0 Flash في معظم المقاييس المعلنة، كما يحقق تقييم ELO بلغ 1417 على منصة LMArena.
نموذج Llama 4 Behemoth: يُعد هذا النموذج بمثابة "المعلم" للنموذجين السابقين، وقد تم استخدامه لتدريبهما عبر تقنيات متقدمة، لكنه ليس موجهًا للاستخدام المباشر حاليًا. ويتضمن نحو 288 مليار باراميتر نشط و16 خبيرًا، بإجمالي يقترب من تريليونَي باراميتر، ويتفوق على GPT-4.5 وClaude Sonnet 3.7 وGemini 2.0 Pro في اختبارات STEM المتخصصة.
تقنيات متقدمة اعتمدت ميتا في Llama 4 على بنية جديدة تعرف باسم Mixture of Experts، بحيث يتم تنشيط جزء فقط من الباراميترات لكل رمز، ما يُحسن الكفاءة ويقلل من التكلفة.
وتم تدريب النماذج باستخدام أكثر من 30 تريليون رمز من بيانات نصوص وصور وفيديوهات، باستخدام دقة FP8 العالية ومعايير جديدة لضبط المتغيرات.
في حين قدمت الشركة.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من فوربس الشرق الأوسط