08/04/2024 08:36AM
استنفد مختبر الذكاء الاصطناعي OpenAI كل مخزونه من النصوص باللغة الإنجليزية على الإنترنت أثناء تطويره لأحدث التقنيات حيث احتاج إلى مزيد من البيانات لتدريب الإصدار التالي من أدواته.
فقد أنشأ باحثو OpenAI أداة للتعرف على الكلام تسمى Whisper، حيث يمكن لهذه الأداة نسخ الصوت من مقاطع فيديو على يوتيوب، مما ينتج عنه نص محادثة جديد من شأنه أن يجعل الذكاء الاصطناعي نظاما أكثر ذكاءً.
وكشف ثلاث أشخاص مطلعين على المحادثات أن بعض موظفي OpenAI ناقشوا كيف يمكن أن تتعارض هذه الخطوة مع قواعد يوتيوب.
لا سيما أن موقع يوتيوب، المملوك لشركة غوغل، يحظر استخدام مقاطع الفيديو الخاصة به للتطبيقات المستقلة عن منصة الفيديو، بحسب تقرير لصحيفة "نيويورك تايمز".
أكثر من مليون ساعة
ونسخ فريق OpenAI أكثر من مليون ساعة من مقاطع الفيديو على موقع يوتيوب، على حد قول الأشخاص.
فيما أضاف اثنان من الأشخاص أن الفريق يضم غريغ بروكمان، رئيس OpenAI، الذي ساعد شخصياً في جمع مقاطع الفيديو.
ثم تم إدخال النصوص في نظام يسمى GPT-4، والذي كان يعتبر على نطاق واسع أحد أقوى أنظمة الذكاء الاصطناعي في العالم.
تحويل المقاطع لنصوص
يذكر أن الشركة كانت قد دربت عام 2021 نماذجها على كافة مصادر البيانات المفيدة، وبحثت فكرة تحويل مقاطع الفيديو والبودكاست والكتب الصوتية في يوتيوب إلى نصوص كأفضل الموارد المتاحة للبيانات.
وفي ذلك الوقت، كانت الشركة قد دربت نماذجها على بيانات تضمنت الأكواد البرمجية في منصة Github، ومحتوى الواجبات المدرسية في منصة Quizlet وغيرها.
شارك هذا الخبر
الخارجية المصرية تجدد تأكيد رفضها القاطع لتهجير الفلسطينيين
الحاج حسن: الخطر على لبنان من الأميركي والإسرائيلي
اتحاد بلديات الجرد الأعلى – بحمدون: جنبلاط رمز وطني وعربي
البعريني ل"حزب الله": بأي منطق تفرضون قوتكم على اللبنانيين
اتحاد بلديات الحاصباني ومخاتير حاصبيا: لاستبعاد خطاب التخوين وتغليب الحكمة
البنك المركزي المصري يوافق على إطلاق أول بنك رقمي تحت اسم "وان بنك"
بلديات راشيا تستنكر التعرض لجنبلاط وتؤكد دعم مواقفه الوطنية
موسكو تراهن على المرشح المصري لقيادة اليونسكو
آخر الأخبار
أهم الأخبار و الفيديوهات في بريدك الالكتروني
إشتراك
Contact us on
[email protected] | +96176111721
Copyright 2023 © - Elsiyasa