أحدثت شركة DeepSeek الصينية ضجة كبيرة بعد إطلاق نموذج الذكاء الاصطناعي DeepSeek R1، الذي قدم أداءً منافسًا لنماذج ChatGPT من شركة OpenAI بميزانية تدريب أقل بكثير واعتمادًا على رقاقات ذكاء اصطناعي قديمة.
شركة DeepSeek تطلق سلسلة Janus Pro لتوليد الصور
الآن، تواصل الشركة تطورها بإطلاق نموذج متقدم لتوليد الصور يهدف لمنافسة أبرز الأسماء في هذا المجال.
أعلنت DeepSeek عن سلسلة Janus Pro لتوليد الصور، المتوفرة على منصتي GitHub وHugging Face. وتتضمن هذه السلسلة نماذج بحجم مليار وسبعة مليارات معلمة.
وتدّعي الشركة أن النموذج الأكبر يمكنه منافسة أو حتى التفوق على نماذج Stable Diffusion وDALL-E 3 في اختبارات الأداء.
ومع ذلك، أُجريت هذه المقارنات على إصدارات أقدم من Stable Diffusion، لكنها تظل إنجازًا مثيرًا للإعجاب إذا تم تأكيده.
قيود تقنية وحلول مستقبلية
من الجدير بالذكر أن حجم الصور المدخلة في نموذج Janus Pro يقتصر على 384×384 بيكسل، وفقًا لتقارير TechCrunch، بينما الصور الناتجة من العرض التجريبي على Hugging Face تصل إلى 768×768 بيكسل. هذه القيود قد تمثل تحديًا حاليًا، لكن يتوقع أن تعالج الشركة هذه النقطة في التحديثات القادمة.
ورغم هذه التحديات، نشرت DeepSeek مقارنة بين النموذج الأولي ونموذج Janus Pro 7B، وأظهرت الصور تحسينات كبيرة، ما يعكس تطورًا ملحوظًا في الأداء.
تجربة الأداء في الواقع
توفرت نسخة تجريبية من نموذج Janus Pro 7B على Hugging Face، لكن الأداء لم يكن مُبهرًا مقارنة بنماذج منافسة مثل Microsoft Copilot المدعوم بـ DALL-E 3.
الخلاصة:
بهذه الابتكارات، تثبت DeepSeek أنها قادرة على تحدي الكبار، سواء في مجالات معالجة النصوص أو توليد الصور، مع تقديم تقنيات تتسم بالكفاءة وتكلفة تشغيل منخفضة. يبدو أن الشركة تواصل صعودها لتصبح لاعبًا رئيسيًا في عالم الذكاء الاصطناعي.