DeepSeek V3.. النموذج الصيني الأحدث الذي يتحدى عمالقة الذكاء الاصطناعي
كشفت شركة DeepSeek الصينية عن نموذجها الذكي الجديد DeepSeek V3، الذي حقق تفوقًا ملحوظًا على العديد من النماذج الأخرى في مجالات متعددة، مثل كتابة النصوص البرمجية، والترجمة الفورية، وتوليد النصوص.
معلومات عن شركة DeepSeek
وقدمت الشركة النموذج الجديد للاستخدامات المتنوعة، بما في ذلك التجارية، مع إمكانية حصول المطورين على تراخيص لاستخدامه بشكل رسمي.
وأظهر DeepSeek V3 أداءً استثنائيًا في اختبارات منصة Cpdefprces المتخصصة في البرمجة الآلية، حيث تغلب على نماذج بارزة مثل Llama 3.1 405B من Meta، وGPT-4o من OpenAI، ونموذج Qwen 2.5 72B الأحدث من Alibaba.
كما سجل أرقامًا قياسية في اختبار Aider Polyglot، الذي يقيس كفاءة النماذج في كتابة أكواد جديدة تتوافق مع الكود الموجود مسبقًا.
ويرجع هذا التفوق إلى قاعدة البيانات الضخمة التي تم تدريب النموذج عليها، والتي تتألف من 12.8 تريليون توكن، وهي وحدة لقياس حجم البيانات النصية، حيث يوازي كل مليون توكن حوالي 750 ألف كلمة.
مميزات النموذج الصيني
كما يتميز النموذج بوجود 685 مليار متغير، مما يجعله أكبر بنسبة 60% من النموذج المفتوح المصدر الأضخم لدى Meta، الذي يتكون من 405 مليارات متغير.
تجدر الإشارة إلى أن زيادة عدد المتغيرات في نماذج الذكاء الاصطناعي ترتبط بتحسين القدرات وتوسيع المهارات، ما يجعل DeepSeek V3 نموذجًا متقدمًا في مجالات متعددة.