Close

تقوم OpenAI بتحديث ChatGPT ودعم إدخال الصورة و الصوت



يتطور ChatGPT (أحد أكبر قصص النجاح التكنولوجي في الآونة الأخيرة) ليصبح أكثر من مجرد محرك بحث قائم على النصوص، حيث أعلنت OpenAI اليوم أنها تضيف ذكاءً جديدًا قائمًا على الصوت والصورة إلى هذا المزيج.
تقوم OpenAI بتحديث ChatGPT ودعم إدخال الصورة و الصوت

يأتي هذا الإعلان في نفس اليوم الذي التزمت فيه أمازون باستثمار ما يصل إلى 4 مليار دولار في شركة Anthropic المنافسة لـ OpenAI، وهي خطوة تشكل جزءًا من معركة ذكاء اصطناعي أكبر بين عمالقة التكنولوجيا في العالم والتي تشمل محاولة قوقل اللحاق بالركب عبر Bard chatbot الخاص بها، والتزام مايكروسوفت الآخر مع الشراكة والتطوير مع OpenAI .
على كلٍ، مع هذا التحديث ستقوم OpenAI بدعم ChatGPT إدخال الصورة و الصوت، ليتمكن المستخدم من أن يطلب شفهيًا من ChatGPT أي شيء يريده، مع بعض المطالبات الصوتية حسب الموضوع، أو مثلًا يمكن للمستخدم ببساطة أن يطرح سؤالاً، مع تقديم ChatGPT إجابته في شكل كلمة منطوقة.
كذلك، سيتمكن مستخدمو ChatGPT من البحث عن الإجابات باستخدام الصور، على سبيل المثال تحميل صورة لشيء ما ومطالبة ChatGPT بشرح ما هو، أو تقديم تعليمات حوله.
من جانبه، سيتم تشغيل ميزة الصوت بواسطة نموذج جديد لتحويل النص إلى كلام يمكنه إنشاء أصوات تشبه الأصوات البشرية من النص وبضع ثوانٍ من عينات الكلام، وقالت OpenAI إنها تعاونت مع ممثلين صوتيين معروفين لإنشاء خمسة أصوات مختلفة، مع نظام التعرف على الكلام Whisper مفتوح المصدر المستخدم في نسخ الكلام اللفظي إلى نص.
كما وتم الكشف أيضًا عن Spotify كشريك إطلاق، حيث قدم عملاق بث الموسيقى ميزة جديدة رائعة لمنشئي البودكاست تسمح لهم بأخذ عينات من أصواتهم وترجمة عروضهم من الإنجليزية إلى الإسبانية أو الفرنسية أو الألمانية مع الاحتفاظ بصوتهم الأصلي ، ومع ذلك، يبدو أن OpenAI تحرص على عدم جذب الانتقادات، لأنها لا تجعل هذه التكنولوجيا متاحة لأي شخص، فقد عملت بشكل خاص مع مدونين صوتيين مشهورين من أجل الإطلاق.
وعبر مدونتها الرسمية، أشارت الشركة “إن تقنية الصوت الجديدة القادرة على صياغة أصوات اصطناعية واقعية من بضع ثوانٍ فقط من الكلام الحقيقي، ستفتح الأبواب أمام العديد من التطبيقات الإبداعية التي تركز على إمكانية الوصول، ومع ذلك، فإن هذه القدرات تمثل أيضًا مخاطر جديدة، مثل احتمال قيام الجهات الفاعلة الخبيثة بانتحال شخصيات عامة أو ارتكاب عمليات احتيال.”
في الختام، سيبدأ طرح الميزات الجديدة لمشتركي Plus وEnterprise خلال الأسبوعين المقبلين، ولتفعيل الميزات الصوتية، يحتاج المستخدم إلى التوجه إلى قائمة “الإعدادات” في التطبيق، ثم التوجه إلى “الميزات الجديدة” والاشتراك في المحادثات الصوتية، ويتعين عليهم بعد ذلك النقر على زر السماعة في الأعلى واختيار الصوت الذي يريدونه، على أن يقتصر الصوت على تطبيق ChatGPT على أساس الاشتراك التجريبي في البداية على اندرويد، بينما سيتم توفير البحث عن الصور على جميع الأنظمة الأساسية افتراضيًا.

ليست هناك تعليقات: