مادة إعلانيـــة في ذروة المنافسة العالمية على تطوير نماذج الذكاء الاصطناعي، بخاصة النماذج اللغوية الكبيرة، لم تعد الآليات التي تُجمع بها البيانات مجرد تفاصيل تقنية، بل تحولت إلى ساحة صراع تنظيمي وأخلاقي تتقاطع فيها قضايا الخصوصية والملكية الفكرية والحوكمة الرقمية.
وتأتي وثيقة منظمة التعاون الاقتصادي والتنمية (أكتوبر 2025) لتضع خريطة دقيقة لهذا المشهد، مُصنِّفة آليات جمع البيانات ومسلطة الضوء على فجوة متنامية بين الممارسات الأخلاقية والممارسات التجارية.
وفي عالمٍ تعد فيه البيانات وقوداً حيوياً لصناعة الذكاء الاصطناعي، يبرز سؤال محوري: كيف نوازن بين الحاجة الهائلة للبيانات وحماية حقوق الأفراد؟
البيانات المباشرة
قسمت خريطة OECD آليات جمع البيانات في مستواها الأول إلى البيانات المجمعة مباشرة من الأفراد أو المنظمات، وهي فئة تُبنى على مسارين رئيسين يشكلان الأساس الأولي لتغذية نماذج الذكاء الاصطناعي هما: البيانات المقدمة والبيانات المراقبة.
فالبيانات المقدمة هي تلك التي يشاركها الأفراد طواعية، كتفاعلات المستخدمين مع روبوتات الدردشة أو مساهماتهم في الأنظمة الذكية. أما البيانات المراقبة، فهي التي تُجمع دون تدخل مباشر من المستخدم، عبر تتبع أنشطته في التطبيقات والخدمات الرقمية، خاصة ضمن بيئات الأعمال للمستهلك (B2C).
ويزداد الاعتماد على هذا النوع من البيانات مع توسع شركات التكنولوجيا التي تمتلك منصات ضخمة قادرة على رصد سلوك المستخدمين بشكل دقيق، مما يخلق مخزوناً بياناتياً هائلاً يُستخدم لتدريب النماذج وتحسين أدائها.
لكن هذه البيانات تطرح إشكاليات تتعلق بالشفافية والخصوصية، إذ يجد المستخدمون أنفسهم في كثير من الأحيان غير مدركين لحجم البيانات التي يجري التقاطها واستغلالها.
تبرعات البيانات
ضمن فئة البيانات المباشرة، تبرز آلية التبرعات الطوعية باعتبارها مقاربة جديدة تحمل وعودا مستقبلية. فالاعتماد على تبرع الأفراد أو المؤسسات ببياناتهم يفتح الباب أمام توفير معلومات متنوعة وواقعية تعكس الأنماط البشرية بشكل أفضل.
ورغم أن هذه الممارسات لا تزال في بداياتها، فإنها تمثل مساراً أكثر شفافية وأخلاقية من غيرها، لأنها تمنح الأفراد سلطة فعلية على بياناتهم وتحدد شروط استخدامها مسبقاً.
ومع ذلك، تظل التحديات قائمة، أبرزها القدرة على جمع حجم بيانات كافٍ لتدريب نماذج ضخمة، إضافة إلى ضرورة ضمان عدم استغلال المتبرعين كأصول مجانية في اقتصاد بيانات يزداد ربحية وتعقيداً.
بيانات الطرف الثالث
إذا كانت البيانات المباشرة تعتمد على المستخدمين، فإن وثيقة OECD ترى أن الفئة الثانية تعتمد على الأطراف الأخرى. وهنا تلعب اتفاقيات الترخيص التجاري دوراً محورياً، إذ تلجأ شركات تطوير الذكاء الاصطناعي إلى شراء أو استئجار مجموعات بيانات من منظمات تمتلك قواعد ضخمة ومنظمة.
ويعد هذا الأسلوب من أكثر الآليات احترافاً، خاصة مع نمو أسواق البيانات ووسطاء البيانات الذين يديرون عمليات بيع وتوزيع البيانات.....
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه
هذا المحتوى مقدم من صحيفة الوطن السعودية
