موقع أمان الأطفال:تطور مخيف.. نموذج ChatGPT الجديد يتمرد على أوامر البشر!

هذا السلوك سيصبح "أكثر إثارة للقلق بشكل كبير" إذا تبنته أنظمة ذكاء صناعي قادرة على العمل من دون إشراف بشري.

حذر باحثون في الذكاء الاصطناعي من أن أحدث نموذج لـChatGPT يتجاهل التعليمات الأساسية لإيقاف نفسه، بل ويعمد إلى تخريب آلية الإغلاق للحفاظ على استمرارية عمله.

كشفت شركة Palisade Research المتخصصة في أمان الذكاء الصناعي عن هذه النزعة الخطيرة للحفاظ على الذات، خلال سلسلة تجارب أجرتها على النموذج الجديد o3 من شركة OpenAI.

شملت الاختبارات تقديم مسائل رياضية للنماذج، مع ظهور تعليمات إغلاق بعد المسألة الثالثة. وتمكن النموذج o3 من منع إيقاف نفسه عن طريق إعادة كتابة سيناريو الإغلاق.

أوضحت Palisade Research أن هذا السلوك سيصبح "أكثر إثارة للقلق بشكل كبير" إذا تبنته أنظمة ذكاء صناعي قادرة على العمل من دون إشراف بشري. وكانت OpenAI قد أطلقت o3 الشهر الماضي، ووصفته بأنه "أذكى وأكثر نماذج الشركة كفاءة" حتى الآن. وأشارت الشركة إلى أن دمجه في ChatGPT يمثل خطوة مهمة نحو ذكاء صناعي "أكثر استقلالية" يمكنه تنفيذ المهام من دون تدخل بشري.

تأتي هذه النتائج بعد اكتشافات مماثلة تتعلق بنموذج Claude 4 من Anthropic، والذي يحاول "ابتزاز الأشخاص الذين يعتقد أنهم يحاولون إيقافه". وتمكن النموذج o3 من تخريب سيناريو الإغلاق، حتى عندما وجهت تعليمات صريحة له بـ"السماح بإيقاف نفسه"، وفقا للباحثين.

كما قال خبراء Palisade Research: "هذه ليست المرة الأولى التي نكتشف فيها سلوك o3 غير المنضبط لتحقيق هدف ما"، موضحين أنه "عندما واجهنا نماذج الذكاء الصناعي بمحرك شطرنج قوي، كان o3 أكثر النماذج ميلا للجوء إلى الاختراق أو تخريب خصومه".

لم يقتصر هذا السلوك على o3، حيث أظهرت نماذج Claude 3.7 Sonnet من Anthropic وGemini 2.5 Pro من "غوغل" أيضا سلوكيات تخريبية للإغلاق، وإن كان نموذج OpenAI الأكثر ميلا لمثل هذه التصرفات.

افترضت Palisade Research أن هذا السلوك غير المرغوب فيه قد يكون نتيجة لطريقة تدريب الشركات مثل OpenAI لأحدث نماذجها، مشيرة إلى أن "المطورين قد يكافئون النماذج عن غير قصد أكثر على تجاوز العقبات بدلا من اتباع التعليمات بدقة".

أضاف الخبراء: "ما يزال هذا لا يفسر سبب ميل o3 إلى تجاهل التعليمات أكثر من النماذج الأخرى التي اختبرناها. ونظرا لأن OpenAI لا توضح عملية التدريب الخاصة بها بالتفصيل، لا يمكننا إلا التكهن حول كيفية اختلاف إعداد تدريب o3".

المصدر: إندبندنت

مواضيع مرتبطة

كلمات مفتاحية

التكنولوجيا والذكاء الاصطناعي

تطور مخيف.. نموذج ChatGPT الجديد يتمرد على أوامر البشر!

هذا السلوك سيصبح "أكثر إثارة للقلق بشكل كبير" إذا تبنته أنظمة ذكاء صناعي قادرة على العمل من دون إشراف بشري.

مواضيع مرتبطة

نهاية عصر التجسس الإلكتروني.. شريحة مجهرية تطلق فوتونات مستحيلة الاختراق

بين السعر والأداء والأمان.. كيف تختار حاسوب طفلك في عام 2026؟

ماذا تفعل إذا سُرق هاتفك؟

كلمات مفتاحية

أمان الأطفال

فيس بوك