بالأمس كنّا على موعد مع اطلاق شركة OpenAI لـ GPT-4 أحدث إصدار من روبوت الدردشة ChatGPT الذي يحظى بشعبية كبيرة في مجال الذكاء الاصطناعي، وهذا النموذج بمثابة نموذج كبير متعدد الوسائط يمكنه قبول كلٍ من إدخالات الصور والنص وإنشاء مخرجات نصية، كما ويُمثّل الإصدار GPT-4 علامة بارزة في مجال الذكاء الاصطناعي ، لا سيما في معالجة اللغة الطبيعية، عمومًا في هذا المقال، نقدم تحليلاً شاملاً للقدرات والإمكانيات الجديدة التي يفتحها GPT-4 ونتعمّق في تاريخ الإصدارات السابقة له.
أولًا: ما هي المحولات التوليدية المدربة مسبقًا (GPT) ؟
باختصار، (GPT) هي نوع من نماذج التعلم العميق المستخدمة لإنشاء نص يشبه الإنسان، وتشمل الاستخدامات الشائعة له “الاجابة عن الاسئلة، تلخيص النص، ترجمة النص إلى لغات أخرى، توليد كود، إنشاء منشورات المدونة والقصص والمحادثات وأنواع المحتوى الأخرى”، بالمقابل، هناك تطبيقات لا حصر لها لنماذج GPT ، ويمكنك حتى ضبطها وفقًا لبيانات محددة للحصول على نتائج أفضل، وباستخدام المحولات ، ستوفر تكاليف الحوسبة والوقت والموارد الأخرى.
ثانيًا: ما قبل GPT
أصبحت ثورة الذكاء الاصطناعي الحالية للغة الطبيعية ممكنة فقط مع اختراع نماذج المحولات ، بدءًا من Google BERT في عام 2017، وقبل ذلك، تم إنشاء النص باستخدام نماذج التعلم العميق الأخرى، مثل الشبكات العصبية المتكررة (RNN) والشبكات العصبية للذاكرة قصيرة المدى التي تدوم لفترة أطول (LSTMs)، وقد كان أداءها جيدًا لإخراج كلمات مفردة أو عبارات قصيرة ولكن لا يمكنها إنشاء محتوى واقعي أطول.
كما وكان نهج المحولات الخاص بـ BERT بمثابة اختراق كبير لأنه ليس أسلوب تعلم خاضع للإشراف، أي أنها لا تتطلب مجموعة بيانات مشروحة باهظة الثمن لتدريبها، حيث تم استخدام BERT بواسطة قوقل لتفسير عمليات البحث باللغة الطبيعية ، ومع ذلك ، لا يمكنه إنشاء نص من موجه.
GPT-1
في عام 2018 ، كانت بدايات OpenAI مع GPT-1 وكان يتمحور في الأساس حول استخدام فهم اللغة الطبيعية مع هذا النموذج، بنفس الوقت، كان GPT-1 إثباتًا للمفهوم ولم يتم إصداره للجمهور.
GPT-2
في العام التالي ، نشرت OpenAI نموذج اللغة متعدد المهام الغير خاضع للإشراف، وهذه المرة تم توفير النموذج لمجتمع التعلم الآلي ووجد بعض التبني لمهام إنشاء النص، ومعه تم إنشاء بضع جمل، وهذا كان أحدث ما توصلت إليه التكنولوجيا في عام 2019.
GPT-3
في عام 2020 ، نشرت OpenAI النموذج الثالث GPT-3 والذي يحتوي على معلمات أكثر 100 مرة من GPT-2 وتم تدريبه على مجموعة بيانات نصية أكبر، مما أدى إلى أداء نموذج أفضل، واستمر تحسين النموذج مع العديد من التكرارات المعروفة باسم سلسلة GPT-3.5، بما في ذلك ChatGPT التي تركز على المحادثة، حيث فاجأ هذا الإصدار العالم بقدرته على إنشاء صفحات من نصوص شبيهة بالبشر، وأصبح تطبيق الويب الأسرع نموًا على الإطلاق، حيث وصل إلى 100 مليون مستخدم في شهرين فقط.
ثالثًا: ما الجديد في GPT-4؟
تم تطوير نموذج GPT-4 الأحدث لتحسين القدرة على متابعة نوايا المستخدم مع جعلها أكثر صدقًا وتوليد مخرجات أقل هجومًا أو خطورة، وإليكم أبرز جديده:
تحسينات في الأداء
كما قد تتوقع ، تعمل GPT-4 على تحسين نماذج GPT-3.5 فيما يتعلق بالصحة الواقعية للإجابات، وقد سجّل GPT-4 نسبة 40٪ أعلى من GPT-3.5 في معيار الأداء الواقعي الداخلي لـ OpenAI، كما أنه يحسن “القدرة على التوجيه” ، وهي القدرة على تغيير سلوكه وفقًا لطلبات المستخدم، مثلًا، يمكنك أن تأمره بالكتابة بأسلوب أو نغمة أو صوت مختلف، وحاول بدء المطالبات بـ “أنت خبير بيانات ثرثار” أو “أنت خبير بيانات مقتضب” واجعله يشرح لك مفهوم علم البيانات، والأهم من ذلك، هناك تحسّن إضافي في تمسك GPT-4 بعدم القيام بأشياء بغيضة أو غير قانونية.
استخدام المدخلات المرئية في GPT-4
يتمثل أحد التغييرات الرئيسية في أن GPT-4 هي في إمكانية استخدامه مدخلات الصور (معاينة البحث فقط والغير متاحة بعد للجمهور) والنص، حيث يمكن للمستخدمين تحديد أي مهمة تتعلق بالرؤية أو اللغة عن طريق إدخال نص وصور متناثرة، وتبرز الأمثلة المعروضة GPT-4 في تفسير الصور المعقدة بشكل صحيح مثل المخططات والميمات ولقطات الشاشة من الأوراق الأكاديمية، كما ملاحظ في مجموعة الأمثلة أدناه.
معايير أداء GPT-4
قامت OpenAI بتقييم GPT-4 من خلال محاكاة الامتحانات المصممة للبشر، مثل Uniform Bar Examination و LSAT للمحامين ، و SAT للقبول بالجامعة، وقد أظهرت النتائج أن GPT-4 حقق أداءً مذهل في مختلف المعايير المهنية والأكاديمية.
أيضًا، قامت OpenAI بتقييم GPT-4 وفقًا للمعايير التقليدية المصممة لنماذج التعلم الآلي، حيث تفوقت على نماذج اللغات الكبيرة الحالية ومعظم النماذج الحديثة التي قد تتضمن صياغة خاصة بالمعايير أو بروتوكولات تدريب إضافية، وتضمنت هذه المعايير أسئلة متعددة الخيارات في 57 موضوعًا، والتفكير المنطقي حول الأحداث اليومية، وأسئلة الاختيار من متعدد في المدرسة الابتدائية والمزيد.
كما واختبرت OpenAI قدرة GPT-4 في لغات أخرى عن طريق ترجمة معيار MMLU ، وهو مجموعة من 14000 مشكلة متعددة الخيارات تشمل 57 موضوعًا إلى لغات مختلفة باستخدام Azure Translate، وفي 24 لغة من أصل 26 تم اختبارها، تفوقت GPT-4 على أداء اللغة الإنجليزية لـ GPT-3.5 ونماذج اللغات الكبيرة الأخرى.
بشكل عام ، تشير النتائج الأكثر أساسًا لـ GPT-4 إلى تقدم كبير في جهود OpenAI لتطوير نماذج الذكاء الاصطناعي ذات القدرات المتقدمة بشكل متزايد.
رابعًا وأخيرًا : كيفية الوصول إلى GPT-4
تطلق شركة OpenAI إمكانية إدخال النص في GPT-4 عبر ChatGPT، وهي متاحة حاليًا لمستخدمي ChatGPT Plus الذي يلزم اشتراك 20 دولارًا شهريًا، كما وتوجد قائمة انتظار لـ GPT-4 API، ولم يتم الإعلان عن التوفر العام لقدرة إدخال الصور، كما وهناك OpenAI Evals مفتوح المصدر ، وهو إطار للتقييم الآلي لأداء نموذج الذكاء الاصطناعي ، للسماح لأي شخص بالإبلاغ عن أوجه القصور في نماذجهم وتوجيه المزيد من التحسينات.
في الختام، أشارت شركة OpenAI بأن GPT-4 لديه “مهارات تفكير أكثر تقدمًا” من ChatGPT، حيث يمكن له على سبيل المثال، العثور على أوقات الاجتماعات المتاحة لثلاثة جداول، بنفس الوقت، أعلنت الشركة أيضًا عن شراكات جديدة مع تطبيق تعلم اللغة Duolingo و Be My Eyes ، وهو تطبيق للمعاقين بصريًا، لإنشاء روبوتات محادثة AI يمكنها مساعدة مستخدميها باستخدام لغة طبيعية، ومع ذلك ، مثل سابقاتها ، حذرت شركة OpenAI من أن GPT-4 لا يزال غير موثوق به تمامًا وقد “يسبب الهلوسة” وهي ظاهرة يخترع فيها الذكاء الاصطناعي الحقائق أو يرتكب أخطاء منطقية.
ليست هناك تعليقات: