نموذج ذكي صيني ينافس: إنه DeepSeek!

30/12/2024 09:25AM

أطلقت شركة DeepSeek الصينية نموذج الذكاء الاصطناعي الجديد DeepSeek V3، الذي أظهر تفوقاً ملحوظاً في عدة مجالات، أبرزها كتابة الأكواد البرمجية وإنشاء النصوص. النموذج متاح للاستخدامات المتنوعة، بما فيها التجارية، من خلال تراخيص توافقية تصدرها الشركة المطورة.

ويتميز نموذج DeepSeek V3 بقدرات فائقة أثبتت تميزه أمام نماذج بارزة مثل Llama 3.1 من ميتا، وGPT-4o من OpenAI، ونموذج Qwen 2.5 من علي بابا، وفقاً لاختبارات منصة Cpdefprces للبرمجة الآلية. كما حقق النموذج الصيني أرقاماً قياسية في اختبار Aider Polyglot، الذي يقيم مهارات النماذج في كتابة أكواد جديدة تتماشى مع الكود البرمجي القائم.

وتفوق النموذج يعزى إلى تدريبه على قاعدة بيانات ضخمة تضم 12.8 تريليون توكن، ما يعادل قرابة 750 ألف كلمة لكل مليون توكن. كما يعتمد على 685 مليار متغير، مما يجعله أكبر بنحو 1.6 مرة من أكبر نموذج مفتوح المصدر لدى ميتا. وتؤكد شركة DeepSeek أن النموذج دُرّب خلال شهرين فقط، بميزانية 5.5 مليون دولار، باستخدام رقائق معالجات إنفيديا H800، التي تواجه الآن حظراً أميركياً على التصدير إلى الصين.

ورغم هذا التقدم التقني، يواجه DeepSeek V3 تحديات تتعلق بسيطرة الحكومة الصينية على محتواه. التجارب الأولية أظهرت امتناعه عن الإجابة على أسئلة حساسة مثل أحداث مظاهرات تيانانمين عام 1989، مبرراً رفضه بأنه "مساعد ذكاء اصطناعي متخصص في تقديم ردود مفيدة وغير ضارة". يُذكر أن جميع النماذج المطورة في الصين تخضع لاختبارات حكومية لضمان التزامها بتوجهات الدولة.

وأثارت بعض التفاعلات مع النموذج جدلاً، حيث أفاد مستخدمون على منصة "إكس" بأن النموذج يدّعي أحياناً أنه ChatGPT ويقدم شروحات حول استخدام واجهته البرمجية بنفس الطريقة. هذا السلوك يسلط الضوء على بعض التحديات التي قد تواجهه في بناء هوية مستقلة عن المنافسين العالميين.