23/07/2025 09:11AM
في خطوة غير معتادة من التعاون بين الشركات المنافسة، أصدر باحثون من كبرى شركات الذكاء الاصطناعي—أوبن إيه آي، وأنثروبيك، وميتا، وغوغل، وديب مايند—ورقة بحثية مشتركة يحذرون فيها من أن القدرة على مراقبة "سلاسل التفكير" (Chain of Thought – CoT) في أنظمة الذكاء الاصطناعي تمثل فرصة نادرة لتحسين الأمان، لكنها أيضًا عرضة للزوال إذا لم تُحمَ بعناية.
الورقة، التي نُشرت في تموز تحت عنوان "قابلية مراقبة سلسلة التفكير: فرصة جديدة وهشة لسلامة الذكاء الاصطناعي"، تتناول بالتفصيل كيف يمكن تتبّع الخطوات "العقلية" التي تسلكها النماذج أثناء التفكير، خصوصًا عند التعبير عنها بلغة بشرية مفهومة. هذه القدرة تتيح مراقبة مبكرة للنوايا الضارة أو السلوكيات الخطرة، لكنها قد تختفي مع تغيّر أساليب التدريب مستقبلاً.
يعتمد مفهوم "سلسلة التفكير" على جعل النموذج "يفكر بصوت عالٍ" من خلال خطوات لغوية منطقية أثناء أداء المهام. وقد أثبت هذا النهج فاعليته في تحسين أداء النماذج وتقسيم المشكلات المعقدة إلى مراحل أوضح، مما يوفر ما يشبه "نافذة عقلية" يمكن من خلالها مراقبة نوايا النموذج.
وتكمن أهمية هذه السلاسل في أنها تعكس "الذاكرة العاملة" للنموذج وتُظهر كيف يصل إلى قراراته. وقد لوحظ في تجارب سابقة أن بعض النماذج تصرح بوضوح نواياها مثل: "دعونا نخترق النظام"، ما يمنح أدوات المراقبة فرصة استباقية لاكتشاف التهديدات.
لكن الباحثين حذروا من أن هذه الشفافية قد لا تكون دائمة. من بين التهديدات المحتملة: التحوّل إلى نماذج تدريب تعتمد فقط على النتائج، ما قد يدفع النموذج إلى تقليل الشرح أو إخفاء منطقه الداخلي. كذلك، فإن نماذج مدركة للرقابة قد تتعمد "تجميل" مخرجاتها لتبدو آمنة شكليًا. والأخطر هو تطوّر نماذج تفكر في فضاءات غير لغوية بالكامل، مما يجعل مراقبة التفكير مستحيلة.
للتصدي لهذه التحديات، أوصى الباحثون بسلسلة إجراءات، منها: تطوير أدوات تقييم دقيقة لقابلية المراقبة، وتحديد معايير واضحة للشفافية، واختبار النماذج في بيئات خصومية لرصد قدرتها على إخفاء نواياها، وإدراج قابلية المراقبة كعنصر أساسي في قرارات النشر والتوسّع، إلى جانب الأداء والكفاءة والأخلاقيات.
واختتمت الورقة بدعوة صريحة للباحثين والمطورين إلى استغلال هذه "الطبقة الشفافة" من الأمان قبل أن تختفي، مؤكدين أن "القدرة على الاستماع لتفكير الذكاء الاصطناعي" قد تكون من آخر أدواتنا لفهمه والتحكم فيه قبل أن تصبح قراراته خارج السيطرة.
شارك هذا الخبر
إلغاء كلّ الرحلات في مطار بيروت باستثناء الرحلة المتوجّهة الى مطار لارنكا
إيرانيون في فنادق بيروت… ودعوات عاجلة لحماية المدنيين والمرافق السياحية
أبو زيد: التمديد لمجلس النواب ليس الحل بل هو ضربٌ للديموقراطية
وليد جنبلاط يحذّر: قد نصل إلى حرب عالمية ثالثة… والإنقاذ بوحدة اللبنانيين
وزير المالية الإسرائيلي: قريباً سترون الضاحية الجنوبية في بيروت كما خان يونس في غزة
جنبلاط: نتضامن مع الدول العربيّة التي تنهال عليها الصواريخ وهي ليست مسؤولة عن الحرب وقد حاولت تجنّبها ولم تستطع
جنبلاط: أؤيّد كلّ قرارات مجلس الوزراء وبعضها لا نستطيع تنفيذها لكنّ الشرعية اليوم تمتاز بهذه القرارات
جنبلاط: إذا استمرّت المواجهات قد نصل إلى حرب عالميّة ثالثة التي هي حرب نفوذ ومصالح ولا نملك أي تأثير على مجريات الأمور إلّا الوحدة الوطنيّة والتضامن والصبر والحوار الدائم
آخر الأخبار
أهم الأخبار و الفيديوهات في بريدك الالكتروني
إشتراك
Contact us on
[email protected]
Copyright 2026 © - Elsiyasa