أعلنت شركة ديب سيك الصينية عن إصدار نموذجها الجديد DeepSeek V3، وهو نموذج لغوي واسع النطاق يهدف إلى تعزيز الابتكار في الذكاء الاصطناعي مع ميزة لافتة تتيح تشغيله على أجهزة استهلاكية دون الحاجة إلى بنية تحتية ضخمة.
تم طرح النموذج عبر منصة Hugging Face الشهيرة، ويمتاز بترخيص MIT المفتوح الذي يسمح باستخدامه بشكل مجاني للأغراض التجارية.
وقد أظهرت الاختبارات الأولية أن النموذج قادر على العمل بكفاءة على أجهزة مثل Mac Studio المزود بمعالج Apple M3 Ultra، حيث يحقق سرعة معالجة تتجاوز 20 رمزًا (Token) في الثانية.
إليكم أبرز مميزات نموذج DeepSeek V3
منافسة غير تقليدية: نماذج قوية على أجهزة استهلاكية
يُعد هذا التوجه خروجًا عن النهج التقليدي لنماذج الذكاء الاصطناعي التي تتطلب مراكز بيانات ضخمة. ووفقًا للباحث Awni Hannun، فإن هذه القدرة على تشغيل نموذج واسع على أجهزة محلية تعزز من فرص وصول الذكاء الاصطناعي إلى شريحة أوسع من المستخدمين.
تحسينات تقنية بارزة
يعتمد نموذج DeepSeek V3 على بنية ( Mixture-of-Experts (MoE، التي تتيح استخدام نحو 37 مليار معلمة فقط من أصل 685 مليارًا عند تنفيذ كل مهمة، مما يعزّز الكفاءة ويقلل استهلاك الموارد.
كما يستخدم النموذج تقنيات متقدمة مثل Multi-Head Latent Attention (MLA) وMulti-Token Prediction (MTP)، ما يسهم في تحسين الاحتفاظ بالسياق وتسريع عملية توليد النصوص.
تفوّق في الأداء
تشير التقارير الأولية إلى أن النموذج الجديد يتفوق على الإصدارات السابقة، ويقترب من أداء نماذج منافسة مثل Claude Sonnet 3.5 من Anthropic، لا سيما في المهام غير المرتبطة بالاستدلال المنطقي.
وحقق النموذج 88.5 نقطة في اختبار MMLU للمعرفة العامة، وهو رقم يتفوق به على GPT-4 (87.2) ويقترب من كلود 3.5 (88.3). ومع ذلك، يتميز DeepSeek V3 عن غيره من النماذج بكونه متاحًا للتحميل والاستخدام مجانًا، مما قد يعزز شعبيته بين المطورين والمستخدمين الأفراد.
حل المشكلات المعقدة
أظهر تفوقًا ملحوظًا في اختبار DROP الذي يقيس الفهم القرائي والاستدلال، حيث سجل 91.6 نقطة، متفوقًا بشكل كبير على GPT-4 وكلود 3.5.
تصحيح الأخطاء البرمجية
حقق أداءً قويًا في اختبار HumanEval الخاص بالكود البرمجي، مسجلًا 82.6 نقطة، مما يجعله أداة فعالة في البرمجة وتصحيح الأخطاء.
الرياضيات
أثبت تفوقه في هذا المجال أيضًا، محققًا 90.2 نقطة في اختبار MATH-500، مقارنة بـ GPT-4 (74.6) وكلود 3.5 (78.3).
مهام اللغة الصينية
حصل على 86.5 نقطة في اختبار C-Eval للغة الصينية، متجاوزًا منافسيه بفارق ملحوظ
خيارات وصول متعددة
يمكن للمستخدمين الوصول إلى DeepSeek-V3 عبر عدة منصات، منها Hugging Face، وواجهة OpenRouter API، بالإضافة إلى منصة DeepSeek Chat. كما تتيح شركة Hyperbolic Labs إمكانية استخدام النموذج من خلال خدمات الاستدلال الخاصة بها.
هذا الإصدار يعكس طموح شركة ديب سيك في مواصلة الابتكار وتوسيع نطاق استخدام الذكاء الاصطناعي، مما يُضفي زخمًا جديدًا على المنافسة العالمية في هذا المجال المتسارع.
خلاصة مميزات إصدار DeepSeek V3 الجديد
ترخيص مفتوح المصدر (MIT): يتيح الاستخدام المجاني للأغراض التجارية.
تشغيل محلي على الأجهزة الاستهلاكية: يعمل بكفاءة على أجهزة مثل Mac Studio بمعالج M3 Ultra
سرعة معالجة عالية: يتجاوز سرعة 20 رمزًا في الثانية على الأجهزة المدعومة
كفاءة محسّنة: يعتمد على بنية Mixture-of-Experts (MoE)، ما يقلل استهلاك الموارد مع الحفاظ على الأداء.
تقنيات متقدمة: يشمل تقنيات Multi-Head Latent Attention (MLA) وMulti-Token Prediction (MTP) لتحسين الاحتفاظ بالسياق وتسريع الاستجابة.
أداء متفوق: يتفوق على نماذج منافسة مثل Claude Sonnet 3.5 في المهام غير المرتبطة بالاستدلال.
وصول مرن: يمكن الوصول إليه عبر Hugging Face، وOpenRouter API، ومنصة DeepSeek Chat.
تجربة مجانية للمستخدمين والمطورين: لا يتطلب اشتراكًا مدفوعًا أو بنية تحتية ضخمة لتشغيله.
كلمة أخيرة
باختصار، DeepSeek V3 ليس مجرد نموذج عابر بل هو منافس قوي قد يعيد تشكيل خريطة الذكاء الاصطناعي بمزاياه الفريدة وأدائه الاستثنائي.