أعلنت شركة OpenAI، الخميس، إضافة مجموعة جديدة من مزايا الذكاء الصوتي إلى واجهة البرمجة الخاصة بها API، بهدف مساعدة المطورين على إنشاء تطبيقات قادرة على التحدث مع المستخدمين ونسخ المحادثات وترجمتها بشكل فوري.
وكشفت الشركة عن نموذج صوتي جديد يحمل اسم GPT-Realtime-2 صُمم لتقديم محاكاة صوتية واقعية تتيح إجراء محادثات طبيعية مع المستخدمين.
وأوضحت OpenAI أن النموذج الجديد يعتمد على قدرات استدلال من فئة GPT-5، ما يجعله أكثر قدرة على التعامل مع الطلبات المعقدة مقارنة بالإصدار السابق GPT-Realtime-1.5.
كما أطلقت الشركة ميزة GPT-Realtime-Translate المخصصة للترجمة الفورية أثناء المحادثات، بحيث تتمكن من مواكبة الحديث بشكل لحظي وطبيعي.
وتدعم الميزة أكثر من 70 لغة إدخال يمكن للنظام فهمها، إضافة إلى 13 لغة إخراج يمكن ترجمتها للمستخدم.
إلى جانب ذلك، كشفت OpenAI عن ميزة جديدة لتحويل الكلام إلى نص مباشر تحت اسم GPT-Realtime-Whisper والتي تتيح نسخ.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من صحيفة الغد الأردنية
