""شات جي بي تي" الجديد ... يسمع ويرى ويتكلم"..

يتيح"روبوت الدردشة" للمستخدمين استغلال الصور والمدخلات الصوتية عند طرح الأسئلة الخاصة بهم،

أطلقت شركة "أوبن إيه آي" مزايا جديدة لـ"روبوت الدردشة" الشهير المستند إلى الذكاء الاصطناعي "شات جي بي تي"، تتيح للمستخدمين استغلال الصور والمدخلات الصوتية عند طرح الأسئلة الخاصة بهم، ما يجعله أقرب إلى مساعدي الذكاء الاصطناعي المشهورين؛ مثل: سيري من آبل، والمساعد الصوتي من غوغل.

وقالت "أوبن إيه آي"، في تدوينة أمس الاثنين، إن الميزة الصوتية "تفتح الأبواب أمام العديد من التطبيقات الإبداعية التي تركز على إمكانية الوصول". ومنذ ظهوره لأول مرة في نهاية العام الماضي، اعتُمد "شات جي بي تي" من الشركات لمجموعة واسعة من المهمات، بدءًا من تلخيص المستندات، وحتى كتابة الرموز "الأكواد" البرمجية، ما أدى إلى إطلاق سباق بين شركات التقنية الكبرى، لإطلاق عروضها الخاصة القائمة على الذكاء الاصطناعي التوليدي.

يمكن للمستخدمين الإفادة من ميزة الإدخال الصوتي بالضغط على أيقونة "الميكروفون" ثم الحديث إلى "الروبوت" الذي يستخدم آلية تعرّف الصوت لفهم ما يريده المستخدم، ثم الإجابة عنه صوتيا أيضا. وقالت "أوبن إيه آي"، إن التقنية التي تقف وراء ميزة الإدخال الصوتي تستخدمها شركة "سبوتفاي" لمقدمي البث الصوتي على المنصة، لترجمة المحتوى الخاص بهم إلى لغات مختلفة.

ومن خلال خاصية دعم الصور، يمكن للمستخدمين التقاط صور للأشياء من حولهم، ومطالبة برنامج "الدردشة الآلي" "اكتشاف الأخطاء وإصلاحها، أو استكشاف محتويات ثلاجتك للتخطيط لوجبة معينة، أو تحليل رسم بياني معقد للبيانات المتعلقة بالعمل". وستكون تلك المزايا متاحة مبدئيًا للمشتركين، في خطة "شات جي بي تي بلس"، والعملاء من الشركات وأصحاب الأعمال على مدار الأسبوعين القادمين.

كما يتيح "شات جي بي تي" إمكان استخدام الصور عند طرح الأسئلة، سواء بالتقاطها عبر الكاميرا، أو تحميلها من الجهاز. وكانت شركة أوبن إيه آي أعلنت حديثا عن دمج نموذج "دال إيه" في "شات جي بي تي"، لتمكينه من توليد الصور. وتأتي تلك المزايا الجديدة التي تطرحها الشركة للمستخدمين، وسط تقارير حديثة تشير إلى تراجع عدد المستخدمين خلال الشهور الأخيرة.

من الجدير بالذكر أن "روبوت غوغل بارد" و"بنغ شات" يتيحان مزايا البحث الصوتي، والبحث باستخدام الصور منذ أسابيع.

 

المصدر : رويترز + مواقع إلكترونية

مواضيع مرتبطة

دبوس الذكاء الاصطناعي من شركة هيومان.. ثورة تقنية أم خدعة جديدة؟

تعتمد وظائف دبوس الذكاء الاصطناعي على واجهة تعمل باللمس والأوامر الصوتية

ميتا تطلق Llama 3... «أقوى» AI مفتوح المصدر

يتفوق Llama 3 في مهام التفكير المعقّدة، وتوليد سطور البرمجة، واتباع التعليمات المتعددة الخطوات بدقة.

كلمات مفتاحية

تكنولوجيا