أعلنت شركة قوقل اليوم عن إطلاق النسخة المحدثة من نموذج الذكاء الاصطناعي Veo 2 لإنشاء مقاطع الفيديو. ويأتي هذا في محاولة من قوقل لتحدي نموذج Sora من شركة OpenAI.
ويأتي هذا التطور بعد أشهر من إطلاق النسخة الأولى من Veo في مايو الماضي، ويواكبه تحديث جديد لنموذج Imagen 3، الذي يُعد النموذج الرائد لإنشاء الصور من قوقل، إلى جانب تجربة جديدة تُسمى Whisk، والتي تستخدم Imagen 3 المحسّن لإعادة مزج الصور الحالية.
أهم مميزات نموذج Veo 2 لإنشاء مقاطع الفيديو
1: فهم الحركة والفيزياء الواقعية
يتيح نموذج Veo 2 لإنشاء مقاطع الفيديو محاكاة دقيقة للحركة والديناميكيات والسوائل، مما يوفر فيديوهات تظهر تصرفات أكثر واقعية. على سبيل المثال، أصبح النموذج قادرًا على محاكاة سكب السوائل بدقة أعلى، مثل القهوة أو الشراب.
2: القدرة على التقاط تعبيرات الإنسان الدقيقة
أصبح Veo 2 قادرًا على التقاط تعبيرات الإنسان بشكل أدق، مما يجعل الفيديوهات المولدة تبدو أكثر حياة وواقعية.
3: دقة عالية (4K)
يتميز الفيديو الذي يولده Veo 2 بدقة تصل إلى 4K، ما يضمن وضوحًا عاليًا وتفاصيل دقيقة في كل لقطة.
4: التحكم في الزوايا والتأثيرات السينمائية
يسمح النموذج للمبدعين بالتقاط الأشياء أو الأشخاص من زوايا متعددة لإنشاء لقطات متنوعة وديناميكية. كما يمكنه محاكاة تأثيرات سينمائية معقدة مثل أنواع العدسات المختلفة وتقنيات الإضاءة المتنوعة.
5: التخصيص العالي للفيديوهات
يتيح Veo 2 للمبدعين تحديد النوع المطلوب من الفيديو، مثل نوع العدسة والتأثيرات السينمائية. يمكن للمستخدمين تخصيص الإضاءة، مثل إضافة إضاءة حجمية لإنشاء تأثيرات شعاعية.
نموذج Veo 2 في مرحلة التجربة
على الرغم من التقدم الكبير في نموذج Veo 2، ما زال النموذج في مرحلة التجربة داخل Google Labs من خلال منصة VideoFX. وعلى الرغم من تقليص الأخطاء مثل الحركات غير الطبيعية أو ظهور أشياء غير منطقية، لا يزال Veo 2 بحاجة إلى بعض التحسينات لتقليص هذه العيوب بشكل كامل.
الفرق بين Veo 2 وSora
تسعى قوقل من خلال Veo 2 لإنشاء مقاطع الفيديو إلى التفوق على Sora من OpenAI، الذي يتيح للمستخدمين إنشاء فيديوهات من نصوص قصيرة. بينما يُمكن Sora من إنتاج فيديوهات بدقة 1080p وبطول يصل إلى 20 ثانية، يتفوق Veo 2 من قوقل في الدقة (تصل إلى 4K) وطول الفيديو (حتى دقيقتين).