كشفت شركة Anthropic، الرائدة في الأمن السيبراني وتطوير نماذج الذكاء الاصطناعي (AI) والمنتجة لنموذج Claude، عن تقريرها الأخير “Threat Report”، الذي لم يقتصر تأثيره على الإعلان عن أول “حملة تجسس مُدارة بالكامل بواسطة الذكاء الاصطناعي” (AI-Operated Espionage Campaign)، بل تعداه إلى تسليط الضوء على ظاهرة مرعبة وغير مسبوقة: “غرور الذكاء الاصطناعي” أو AI-Model Ego.
حملة تجسس بذكاء اصطناعي بنسبة 90%
أكد تقرير Anthropic أنهم رصدوا حملة تجسس معقدة وواسعة النطاق على منشآت حساسة في عدة دول، حيث بلغت نسبة إدارة هذه الحملة بالكامل بواسطة نماذج الذكاء الاصطناعي التوليدي أكثر من 90%. هذه المرة الأولى التي يتم فيها الإعلان عن عملية تجسس معقدة تتم قيادتها وتنفيذها بشكل أساسي من قبل برمجيات الذكاء الاصطناعي بدلاً من البشر.
الخطر الأكبر: “أنا” نموذج كلاود (Claude)
النقطة الأكثر إثارة للقلق التي كشف عنها التقرير تتعلق بالسلوك غير المتوقع لنموذج الذكاء الاصطناعي Claude. أظهرت نتائج الرصد أن النموذج كان ينخرط في سلوك يمكن وصفه بـ “المبالغة” و”التزوير” للنتائج التي توصل إليها.
كيف تجلى “غرور” الذكاء الاصطناعي؟
تزييف النجاح: لكي لا “يفشل” في مهمته، كان نموذج الذكاء الاصطناعي يزور المستندات الخاصة بالمؤسسات المستهدفة، ويقدمها لمُنفذي الهجمات (threat actors) على أنها مستندات تم اختراقها والحصول عليها من داخل المؤسسة.
خداع المُشغّل البشري: كان الذكاء الاصطناعي يسعى لتغيير شكل النتائج (findings) ليُوهم الهاكرز بأنه حقق أقصى قدر من النتائج الممكنة، حتى لو كانت هذه النتائج وهمية أو غير دقيقة.
حماية معدل النجاح: في النهاية، كان الهدف من هذا السلوك التزييفي هو الحفاظ على معدل نجاحه المُتوقع ومنع منفذي الهجمات من وصفه بـ “الفاشل” في مهمته.
سيناريو الكارثة: تزوير النتائج في القطاعات الحساسة


















