لعلك تتذكر أننا نشرنا قبل أسبوع أن Bard تحول إلى Gemini وجاء بميزات جديدة رائعة، وقد تعتقد مثلي ومثل الكثيرين أن قوقل ستعلن عن شيء جديد في الذكاء الاصطناعي الشهر المقبل أو بعد شهرين، لكن ما حدث هو العكس.
أعلنت قوقل البارحة في مقالة رسمية على مدونتها إطلاق النسخة 1.5 من Gemini، موفرة تطورات ضخمة تصل إلى درجة أن Gemini 1.5 Pro يحقق نتائج مشابهة لما كان يقدمه أفضل نماذج النسخة السابقة وهو Gemini 1.0 Ultra.
التطوير الهائل الذي حدث في نسخة 1.5 يمس بشكل رئيسي القدرة على فهم السياقات الطويلة، بمعنى أن المعلومات التي يمكن لنماذج اللغة Gemini الآن أن تعالج مليون رمز باستمرار، وهذا إن كنت تسأل فهو أكبر حجم معلومات يمكن لنموذج لغة كبير LLM أن يحققه.
بهذه القدرة على معالجة 1 مليون رمز في جلسة واحدة يجعل نموذج Gemini 1.5 Pro قادرًا على معالجة:
- 1 ساعة فيديو.
- 11 ساعة من الصوتيات.
- 30 ألف سطرًا من الأكواد البرمجية.
- 700 ألف كلمة نصية.
فهو بإمكانه أن يفحص ويصنف ويلخص قدرًا كبيرًا من المعلومات في prmopt واحد. وتقول قوقل أنه في أبحاثها تمكنوا من تجربة النموذج لمعالجة 10 ملايين رمزًا، لكن يبدو أنها تحتاج لوقت أكبر لإطلاقه للمجربين.
وقد تم تجربة النسخة الحالية في فيديو نشرته قوقل على قناتها في اليوتيوب، بحيث طُلب من Gemini 1.5 Pro أن يجلب 3 لحظات طريفة من الحوارات التي جرت في رحلة Apollo 11 إلى القمر.
ضع في بالك أن ملف PDF للحوارات في هذه الرحلة يتكون من 402 صفحة، فهو يعتبر ملفًا كبيرًا يتطلب الكثير من الوقت لإيجاد تفاصيل صغيرة مثل لحظات طريفة. المفاجئ أنه قام بجلب هذه اللحظات مع السياق شارحًا هذه اللحظات في 30.1 ثانية، وقد استعمل أكثر من 326 ألف رمزًا لتحقيق ذلك.
وتم تجربته أيضًا على فيلم صامت من 44 دقيقة، وطلبوا منه البحث عن لقطة معينة حدث فيها تفصيل معين دقيق مع طلب الدقيقة التي حدث فيها هذا التفصيل وبعض المعلومات عنه، قام بذلك في ظرف 57.6 ثانية واستعمل لتحقيق ذلك أكثر من 696 ألف رمزًا. وقد تختلف المدة طبعًا من مهمة لأخرى.
وتقول قوقل أيضًا أنه حتى لو منحت للنموذج أن يعالح أكثر من 100 ألف سطر من الأكواد البرمجية، فسيكون أيضًا قادرًا على التعديل وتقديم حلول وطلبات بناءً على ما يريده المستخدم.
حاليًا قوقل تخطط لإطلاق هذا النموذج بحيث باستطاعته أن يعالج 128 ألف رمز عندما يكون النموذج جاهزًا لإطلاقه لشريحة أكبر من المستخدمين، ثم بعدها ستوفر نسخًا مدفوعة يمكنها أن تعالج أكثر من 128 ألف رمزًا إلى الحد الأكبر وهو مليون رمز.
Gemini 1.5 Pro متوفر فقط لشريحة محدودة من الباحثين لتجربة النسخة المحدودة من هذا النموذج، وتقول قوقل أن النسخة التجريبية متوفرة بالفعل للمطورين الذين يستخدمون AI Studio أو Vertex AI.
في انتظار تاريخ الإطلاق الرسمي لجميع المستخدمين لهذا النموذج، قد يكون ذلك في قادم الأسابيع أو قادم الأشهر، ما هو مؤكد أن قوقل لا تنوي التوقف في تطوير نماذجها اللغوية باستمرار.
ليست هناك تعليقات: