كشفت شركة (Thinking Machines Lab) عن دراسة بحثية لنظام جديد يحمل اسم (Interaction Models)، في خطوة تستهدف إعادة صياغة الطريقة التي يتفاعل بها البشر مع روبوتات الدردشة وأنظمة الذكاء الاصطناعي، عبر الانتقال من أسلوب الأوامر النصية التقليدي إلى تجربة تواصل حية ومتزامنة تشبه المحادثات البشرية.
وترى الشركة أن النماذج الحالية، رغم ما حققته من تطور كبير في الفهم والتوليد، ما تزال تعمل ضمن إطار تفاعلي محدود يعتمد على تبادل الأدوار بصورة جامدة، إذ ينتظر المستخدم حتى ينتهي النموذج من الرد، بينما ينتظر النموذج بدوره حتى يكمل المستخدم حديثه أو كتابته بالكامل قبل أن يبدأ الاستجابة.
ووفقا للدراسة، فإن هذا الأسلوب يخلق ما تصفه الشركة بـ"عنق الزجاجة التفاعلي"، لأنه يحول التفاعل إلى سلسلة أوامر منفصلة بدلاً من حوار حي ومتواصل يسمح للطرفين بالتفاعل اللحظي والتعديل المستمر أثناء المحادثة.
تواصل أكثر بشرية
وتوضح الدراسة أن أغلب شركات الذكاء الاصطناعي تركز حالياً على تطوير أنظمة قادرة على تنفيذ المهام بصورة ذاتية ومستقلة (Agentic Models)، بينما يُنظر إلى التفاعل البشري باعتباره مجرد واجهة استخدام ثانوية.
إلا أن الشركة ترى أن أغلب الأعمال الواقعية لا يمكن فيها للمستخدم تحديد جميع المتطلبات منذ البداية ثم الانسحاب من العملية بالكامل، بل تحتاج إلى وجود الإنسان داخل دائرة التفاعل بشكل دائم لتوضيح المقصود وتقديم الملاحظات وتصحيح المسار أثناء التنفيذ.
ولهذا تعتقد (Thinking Machines Lab) أن مستقبل الذكاء الاصطناعي لن يعتمد فقط على زيادة قدرات النماذج في التفكير، وإنما أيضاً على تطوير أساليب أكثر طبيعية ومرونة للتعاون بين الإنسان والآلة.
وبحسب الدراسة، فإن البشر لا يتواصلون فيما بينهم عبر تبادل رسائل منفصلة ومنظمة بصورة صارمة، بل من خلال محادثات تتضمن المقاطعة والتعقيب والتصحيح اللحظي والإشارات البصرية والسمعية والتفاعل المتزامن.
ومن هنا جاء تصميم النظام الجديد ليحاكي هذه الطبيعة البشرية في التواصل، بحيث يصبح الذكاء الاصطناعي قادراً على الاستماع والرؤية والتحدث والتفاعل في الوقت نفسه، بدلاً من الاكتفاء بالانتظار حتى انتهاء الطرف الآخر من الكلام.
كيف يعمل نموذج Interaction Model الجديد؟
يعتمد المشروع على نموذج تفاعلي مدرك للوقت، يستطيع التعامل مع المحادثة باعتبارها تدفقاً مستمراً ومتزامناً للصوت والفيديو والنصوص، وليس كسلسلة من الأوامر المنفصلة.
وفي النماذج التقليدية، يتوقف النظام عن استقبال أي معلومات جديدة أثناء توليد الإجابة، كما يتجمد إدراكه للسياق حتى ينتهي من الرد، أو تتم مقاطعته يدوياً، بينما في حالة نموذج التفاعل الجديد من الشركة، فيستمر النظام في استقبال وتحليل المعلومات أثناء حديثه، ويمكنه تعديل استجاباته لحظياً بناء على أي تغيرات في الحوار أو السياق.
وتقول الشركة إن النظام الجديد يستطيع فهم ما إذا كان المستخدم ما يزال يفكر أو انتهى من الكلام، كما يمكنه إدراك لحظات التردد أو التصحيح الذاتي أثناء الحديث، والتدخل تلقائياً إذا استدعى السياق ذلك.
كذلك يدعم النموذج التحدث والاستماع في الوقت نفسه، وهو ما يسمح بإجراء ترجمة فورية حية أو تصحيح النطق أثناء استمرار المستخدم في الكلام، إضافة إلى إمكانية التعليق المباشر أثناء مشاهدة محتوى مرئي أو متابعة إشارات بصرية دون الحاجة إلى أوامر صريحة.
وتؤكد الشركة أن هذه القدرات ليست إضافات خارجية، بل جزء مدمج داخل النموذج نفسه، ما يعني أن جودة التفاعل تتحسن تلقائياً كلما تطورت قدرات النموذج الأساسية.
ولتحقيق هذا المستوى من التفاعل اللحظي، طورت الشركة بنية تعتمد على ما تسميه (Micro-turns)، أو "الأدوار المصغرة"، وهي وحدات زمنية قصيرة للغاية تبلغ نحو 200 مللي ثانية فقط، وبدلاً من انتظار انتهاء الجملة أو الفقرة بالكامل، يقوم النظام بمعالجة المدخلات وإنتاج الاستجابات بصورة متزامنة ومتواصلة ضمن دفعات زمنية صغيرة جداً، ما يسمح بتفاعل قريب من الزمن الحقيقي.
وتوضح الدراسة أن كل نافذة زمنية تتضمن معالجة جزء من الصوت أو الفيديو أو النص الوارد، مع توليد جزء من الرد النصي أو الصوتي، وتحديث سياق المحادثة باستمرار، ومتابعة أي تغيرات لحظية في سلوك المستخدم أو ردوده أو السياق الذي يقدمه للنموذج في صورة محتوى نصي أو مصور أو مسموع.
وتشير الشركة إلى أن نقطة الانطلاق الأساسية للنظام كانت بناء نموذج قادر على التعامل مع الصوت والفيديو باعتبارهما وسائط تفاعلية فورية بطبيعتها، لأن المحادثات الحية لا يمكنها تحمل التأخير الطويل المرتبط بمعالجة النصوص فقط.
اقرأ أيضاً
دراسة: نماذج الذكاء الاصطناعي يمكنها "نسخ نفسها" إلى أجهزة كمبيوتر
كشفت دراسة حديثة أن بعض أنظمة الذكاء الاصطناعي باتت قادرة على نسخ نفسها إلى أجهزة كمبيوتر أخرى، في تطور يثير مخاوف بشأن احتمالات خروجها عن السيطرة.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من الشرق للأخبار
