تطور مخيف.. نموذج ChatGPT الجديد يتمرد على أوامر البشر!

تطور مخيف.. نموذج ChatGPT الجديد يتمرد على أوامر البشر!

هذا السلوك سيصبح "أكثر إثارة للقلق بشكل كبير" إذا تبنته أنظمة ذكاء صناعي قادرة على العمل من دون إشراف بشري.

حذر باحثون في الذكاء الاصطناعي من أن أحدث نموذج لـChatGPT يتجاهل التعليمات الأساسية لإيقاف نفسه، بل ويعمد إلى تخريب آلية الإغلاق للحفاظ على استمرارية عمله.

كشفت شركة Palisade Research المتخصصة في أمان الذكاء الصناعي عن هذه النزعة الخطيرة للحفاظ على الذات، خلال سلسلة تجارب أجرتها على النموذج الجديد o3 من شركة OpenAI.

شملت الاختبارات تقديم مسائل رياضية للنماذج، مع ظهور تعليمات إغلاق بعد المسألة الثالثة. وتمكن النموذج o3 من منع إيقاف نفسه عن طريق إعادة كتابة سيناريو الإغلاق.

أوضحت Palisade Research أن هذا السلوك سيصبح "أكثر إثارة للقلق بشكل كبير" إذا تبنته أنظمة ذكاء صناعي قادرة على العمل من دون إشراف بشري. وكانت OpenAI قد أطلقت o3 الشهر الماضي، ووصفته بأنه "أذكى وأكثر نماذج الشركة كفاءة" حتى الآن. وأشارت الشركة إلى أن دمجه في ChatGPT يمثل خطوة مهمة نحو ذكاء صناعي "أكثر استقلالية" يمكنه تنفيذ المهام من دون تدخل بشري.

تأتي هذه النتائج بعد اكتشافات مماثلة تتعلق بنموذج Claude 4 من Anthropic، والذي يحاول "ابتزاز الأشخاص الذين يعتقد أنهم يحاولون إيقافه". وتمكن النموذج o3 من تخريب سيناريو الإغلاق، حتى عندما وجهت تعليمات صريحة له بـ"السماح بإيقاف نفسه"، وفقا للباحثين.

كما قال خبراء Palisade Research: "هذه ليست المرة الأولى التي نكتشف فيها سلوك o3 غير المنضبط لتحقيق هدف ما"، موضحين أنه "عندما واجهنا نماذج الذكاء الصناعي بمحرك شطرنج قوي، كان o3 أكثر النماذج ميلا للجوء إلى الاختراق أو تخريب خصومه".

لم يقتصر هذا السلوك على o3، حيث أظهرت نماذج Claude 3.7 Sonnet من Anthropic وGemini 2.5 Pro من "غوغل" أيضا سلوكيات تخريبية للإغلاق، وإن كان نموذج OpenAI الأكثر ميلا لمثل هذه التصرفات.

افترضت Palisade Research أن هذا السلوك غير المرغوب فيه قد يكون نتيجة لطريقة تدريب الشركات مثل OpenAI لأحدث نماذجها، مشيرة إلى أن "المطورين قد يكافئون النماذج عن غير قصد أكثر على تجاوز العقبات بدلا من اتباع التعليمات بدقة".

أضاف الخبراء: "ما يزال هذا لا يفسر سبب ميل o3 إلى تجاهل التعليمات أكثر من النماذج الأخرى التي اختبرناها. ونظرا لأن OpenAI لا توضح عملية التدريب الخاصة بها بالتفصيل، لا يمكننا إلا التكهن حول كيفية اختلاف إعداد تدريب o3".

المصدر: إندبندنت

مواضيع مرتبطة

ديب سيك الصينية تصدر تحديثا لنموذجها للتفكير المنطقي آر1

قلبت شركة ديب سيك المعتقدات السائدة بأن قيود التصدير الأمريكية تعيق تقدم الذكاء الصناعي ..

هل يمكننا ترك أجهزة الشحن موصولة بالكهرباء طوال الوقت؟

تكمن المشكلة الحقيقية في ما يسمى "باستهلاك الطاقة الوهمي" أو "طاقة مصاص الدماء".

تطوير كاشف كذب للذكاء الصناعي

تقوم هذه المنصة بتقويم موثوقية استنتاجات الذكاء الصناعي فورا.