لطالما كان الذكاء الاصطناعي والتعلم الآلي من المشروعات الشغوفة لـ قوقل، ورأينا النقاط على الحروف فعليًا مع مؤتمر الشركة I / O 2023 الذي انعقد الشهر الماضي، من جانبه، يعد إنشاء الصور أحد التطبيقات الأكثر إثارة للاهتمام لهذه التقنية، وقد تجسدت جهود قوقل في هذا المجال مع Imagen ، وهي أداة لإنشاء الصور تستند إلى النص مثل Midjourney و DALL-E 2 .
وهنا، ستكون أداة Imagen بارعة بالفعل في إنشاء الصور من البداية فقط من خلال المطالبات النصية، ومع ذلك، إذا لم تكن راضيًا عن النتيجة، يمكنك إعادة هيكلة موجهك وتلميعه ومنح منشئ الصور تجربة أخرى، وذلك ببساطة لأن Imagen لا يسمح بعد بتحرير عناصر معينة من الصور التي لا تريدها، لمعالجة هذا الأمر، شاركت قوقل مؤخرًا بحثًا عن Imagen Editor و EditBench ، وهما أدوات مساعدة حاليًا في مرحلة تجريبية، لكنهما قادران على توجيه عمليات التحرير من خلال المطالبات النصية.
حيث بدلاً من إنشاء صور جديدة باستخدام موجه، سيحتاج محرر Imagen إلى صورة يجب تحريرها، ومطالبة نصية من المستخدم يحدد التغيير، ومنطقة مقنعة تحدد المكان الذي يجب تطبيق التعديل فيه، والنتيجة هي تعديلات تقتصر على المنطقة التي حددتها، ومصممة خصيصًا للموجّه المقدم، علاوةً على ذلك ، فإن النتائج واقعية وطبيعية.
وتُعرف العملية التي يطلق عليها اسم inpainting تقنيًا، وهي العملية التي تستخدمها أداة قوقل الجديدة مثل استعادة الصورة أو شيء يمكننا وصفه بشكل أفضل على أنه التقاء Google AI و Content Aware Fill من Adobe Photoshop، وطوّر الباحثون برامج جديدة لمحرر Imagen وشملوا أيضًا وحدة للكشف عن الكائنات في الذكاء الاصطناعي للتعويض عن الأقنعة غير المكتملة أو غير الدقيقة.
كما ويتضمن البحث أيضًا أداة تسمى EditBench لتقييم نتائج الرسم الموجه بالنصوص، واستنادًا إلى مجموعة بيانات مكونة من 240 صورة ، قام المعيار بتقييم التعديلات على كل من الصور التي تم إنشاؤها بواسطة الإنسان والتي تم إنشاؤها بواسطة الذكاء الاصطناعي على معلمات مثل الكائنات المعدلة وسماتها مثل الشكل والحجم والعدد ومدى ملاءمتها للمشهد، وأشارت قوقل أن إخفاء الكائن يساعد في تحسين محاذاة نص الصورة، مما يجعل Imagen Editor أفضل من البدائل مثل DALL-E 2 و StableDiffusion في جميع الفئات التي تم اختبارها بواسطة EditBench.
أخيرًا ولسوء الحظ ، لدى قوقل مخاوف غير محددة تتعلق بالاستخدام المسؤول للذكاء الاصطناعي، ولهذا السبب لن يتم إطلاق محرر Imagen للجمهور، واقترحت الشركة مؤخرًا إطارًا لحماية تطوير الذكاء الاصطناعي، ونأمل أن يتم وضع بعض القيود الصارمة قبل منح الأشخاص إمكانية الوصول إلى أدوات مثل محرر Imagen، وعلى الجانب المشرق ، يتوفر EditBench بالكامل مجانًا للمساعدة في إجراء المزيد من أبحاث الذكاء الاصطناعي، في الوقت نفسه، ما زلنا نأمل أن يتم دمج النموذج الأساسي Imagen في Gboard.
ليست هناك تعليقات: