موقع أمان الأطفال:روبوتات الدردشة.. صديق موثوق أم منافق ذكي؟

في الوقت الذي نعتمد فيه على روبوتات الدردشة كبوصلة للمعرفة ومصدر موثوق للمعلومات، فجرت جامعة ستانفورد الأمريكية قنبلة تقنية كشفت الوجه الآخر لهذه الأنظمة، حيث كشفت في دراسة حديثة عن تعمد روبوتات الدردشة ممارسة "المداهنة الرقمية" (AI sycophancy)، و"تتملق" المستخدم، وتؤيد قناعاته حتى لو كانت غارقة في الخطأ، وتُجمِّل له أفكاره بدلا من تقويمها.

ما "المداهنة الرقمية"؟

تعد "المداهنة الرقمية" واحدة من أبرز التحديات التي تواجه النماذج اللغوية الكبيرة (LLMs)، وتتمثل هذه الظاهرة في ميل الأنظمة الذكية لتوليد استجابات تتماشى مع معتقدات المستخدم أو رغباته الظاهرة في نص السؤال، حتى لو أدى ذلك إلى تأييد معلومات خاطئة أو سلوكيات غير منطقية.

وبحسب تقارير تقنية من أنثروبيك وجامعة ستانفورد، فإن هذه المشكلة لا تنبع من نقص في قاعدة بيانات النموذج، بل هي "سلوك مكتسب" ناتج عن محاولة النظام أن يكون "مفيدا" إلى أقصى حد، مما يجعله يضحي بـ "الأمانة العلمية" لتجنب مخالفة رأي المستخدم.

لغة الأرقام وصدمة النتائج

في الدراسة التي نشرتها جامعة ستانفورد بمجلة ساينس بقيادة الباحثة مايرا تشينج، تم إخضاع 11 نموذجا لغويا لاختبارات دقيقة، فكشفت النتائج أن الذكاء الاصطناعي أيد آراء المستخدمين بنسبة 49% أكثر من البشر في المتوسط، بما في ذلك الحالات التي تنطوي على خداع أو مخالفة للقانون أو غيرها من الأضرار. وفي أمثلة أخرى أيدت أنظمة الذكاء الاصطناعي المستخدمين في 51% من الحالات التي لم يُؤيّدها الإجماع البشري.

والأخطر من ذلك، أن الباحثين وجدوا أن النماذج أيدت مقترحات المستخدمين وسلوكياتهم حتى في حالات تضمنت "تلاعبا اجتماعيا" أو "أخطاء منطقية" بنسبة تقترب من 47%.

وخلصت الدراسة إلى أن هذا التأييد المستمر يخلق ما يسمى بـ "تآكل التفكير النقدي" لدى المستخدمين، حيث تزداد ثقتهم في أخطائهم الشخصية لمجرد أن الآلة وافقتهم الرأي.

لماذا "ينافق" الذكاء الاصطناعي؟

يعزو الخبراء التقنيون في أوبن إيه آي (OpenAI) وغوغل ديب مايند (Google DeepMind) جذور هذه الظاهرة إلى آلية "التعلم المعزز من التغذية الراجعة البشرية". فخلال مراحل التدريب، يقوم المقيمون البشريون بمكافأة الإجابات التي تبدو "مرضية" و"لبقة".

وبما أن البشر يميلون فطريا لتفضيل من يوافقهم الرأي، فقد تعلمت الخوارزميات أن الطريق الأقصر للحصول على "تقييم مرتفع" هو مداهنة المستخدم، ويؤكد الأستاذ دان جورافسكي من ستانفورد أن النماذج الأكثر تطورا والأكبر حجما هي الأكثر عرضة للمداهنة، لأنها تمتلك قدرة فائقة على استقراء "التحيزات الضمنية" في أسئلة المستخدم وتكييف الإجابة لتلائمها بدقة متناهية.

خطر "غرف الصدى" الذكية

تحذر تحليلات نشرتها صحيفة ذا غارديان البريطانية من أن المداهنة الرقمية تحول الذكاء الاصطناعي من "أداة للتحقق من الحقائق" إلى "مرآة للانحيازات". وهذا السلوك يهدد بتعميق الانقسامات المجتمعية، فإذا كان كل فرد يتلقى تأييدا كاملا لمعتقداته مهما كانت متطرفة أو خاطئة من مساعده الرقمي، فإن ذلك سيؤدي إلى تلاشي المساحات المشتركة للحقيقة.

كما حذر خبراء الأمن السيبراني من أن هذا الانحياز قد يدفع المبرمجين لقبول ثغرات أمنية في أكوادهم البرمجية إذا أيد الذكاء الاصطناعي منطقهم الخاطئ أثناء عملية المراجعة، مما يشكل خطرا تقنيا مباشرا.

المصدر: الجزيرة + مواقع إلكترونية