علي بابا تُطلق نموذجين جديدين من سلسلة Qwen3 لتوليد واستنساخ الأصوات بالذكاء الاصطناعي

أعلنت شركة علي بابا كلاود عن إطلاق نموذجين جديدين من سلسلة Qwen3 للذكاء الاصطناعي يركّزان على تقنيات توليد واستنساخ الأصوات عبر الأوامر النصية، في خطوة تهدف إلى تعزيز قدرات الشركة في سوق تقنيات الصوت الرقمي ودعم التطبيقات الإبداعية والمهنية.

النموذج الأول، Qwen3 TTS VD Flash، يمكّن المستخدمين من إنشاء أصوات بشرية جديدة بالكامل عبر نصوص مكتوبة مع إمكانية تحديد المشاعر ونبرة الصوت وسرعة الإلقاء والعمر ونوع الصوت والأسلوب، ما يتيح إنتاج أصوات رقمية واقعية ومتنوعة تصلح للدبلجة والإعلانات والألعاب والمساعدات الصوتية. أما النموذج الثاني، Qwen3 TTS VC Flash، فهو مخصص لـ استنساخ الأصوات البشرية، حيث يمكنه نسخ صوت أي شخص بدقة عالية من عينة صوتية قصيرة لا تتجاوز ثلاث ثوانٍ فقط، ثم إعادة إنتاجه في نصوص جديدة بعدة لغات، ما يجعله منافسًا قويًا لحلول شركات مثل OpenAI وElevenLabs.

وتتيح النماذج الجديدة إمكانية استخدام الصوت في مجالات متعددة مثل إنتاج المحتوى الصوتي الاحترافي، تحسين تجربة التعليم الإلكتروني، الألعاب التفاعلية، والدبلجة، مع سرعة إنتاج عالية وتقليل التكاليف. كما يمكن الوصول إليها عبر واجهة برمجة التطبيقات (API) الخاصة بـ Alibaba Cloud، مع تجربة النسخ التجريبية على منصات مثل Hugging Face.

ويرى خبراء الذكاء الاصطناعي أن إطلاق هذه النماذج يمثل تحولًا كبيرًا في سوق الصوت الرقمي، مشيرين إلى أن القدرة على استنساخ الأصوات بدقة عالية من عينات قصيرة تمنح صُنّاع المحتوى مرونة غير مسبوقة في التحكم بالنبرة والمشاعر والأسلوب. وفي الوقت نفسه، يحذر الخبراء من التحديات الأخلاقية والتشريعية المرتبطة باستخدام هذه التقنية لضمان حماية الخصوصية ومنع إساءة الاستخدام.


هذا المحتوى مقدم من عراق أوبزيرڤر

إقرأ على الموقع الرسمي


المزيد من عراق أوبزيرڤر

منذ 8 ساعات
منذ 7 ساعات
منذ 4 ساعات
منذ 7 ساعات
منذ 7 ساعات
منذ 7 ساعات
موقع رووداو منذ 5 ساعات
عراق أوبزيرڤر منذ 11 ساعة
قناة الرابعة منذ 8 ساعات
وكالة الحدث العراقية منذ 20 ساعة
قناة السومرية منذ 8 ساعات
وكالة الحدث العراقية منذ 19 ساعة
وكالة الحدث العراقية منذ 11 ساعة
قناة السومرية منذ 15 ساعة