في عالم يهيمن عليه الابتكار، تبرز شركة DeepSeek الصينية بإعلانها الأخير عن نماذج ذكاء اصطناعي مبتكرة قد تغيّر قواعد اللعبة. بفضل التكنولوجيا المتقدمة التي تعتمد على التعلم المعزز وخوارزميات جديدة، تهدف هذه النماذج إلى منافسة عمالقة المجال مثل OpenAI. فهل نحن على أعتاب ثورة جديدة في الذكاء الاصطناعي؟ التفاصيل المثيرة بانتظارك في السطور التالية.
DeepSeek تطلق نماذج ذكاء اصطناعي تنافس OpenAI
أعلنت شركة DeepSeek الصينية عن إطلاق نموذجين جديدين للذكاء الاصطناعي، هما R1 و R1-Zero، مصممين لتقديم أداء ينافس نماذج التفكير المنطقي o1 من شركة OpenAI. تُعرف نماذج o1 بقدرتها على التفكير والتحليل قبل تقديم الإجابات، وهي ميزة تسعى DeepSeek إلى محاكاتها بل وتطويرها.
إلى جانب النموذجين الرئيسيين، قدمت الشركة أيضًا 6 نماذج مفتوحة المصدر صغيرة الحجم، تنافس بعضها أداء OpenAI-o1-mini. هذه النماذج، بالرغم من صغر حجمها، قادرة على تقديم أداء استثنائي بفضل تقنيات متطورة في التعلم والاستدلال.
الابتكار في نموذج DeepSeek-R1-Zero
يمتاز نموذج DeepSeek-R1-Zero بطريقة تعلم مبتكرة تعتمد على التعلم المعزز (Reinforcement Learning) دون الحاجة إلى أمثلة بشرية. يعتمد النموذج على نظام مكافآت بسيط وقواعد صارمة لفحص دقة الإجابات، مثل التحقق من صحة الحلول الرياضية والتعليمات البرمجية.
كما طورت الشركة خوارزمية جديدة تتيح تقييم مجموعات الإجابات بدلًا من التقييم الفردي لكل إجابة. هذه التقنية ساهمت في تحسين الأداء العام للنموذج، ما يجعله منافسًا قويًا للنماذج العالمية.
التحديات وحلول نموذج DeepSeek-R1
رغم إمكانياته المذهلة، واجه نموذج R1-Zero مشكلتين رئيسيتين، هما صعوبة قراءة الإجابات وخلط اللغات. لمواجهة هذه التحديات، قدمت DeepSeek نموذج R1، الذي يتم تدريبه على بيانات صغيرة في البداية، ثم يخضع لجولات متعددة من التعلم المعزز لتحسين أدائه.
وفقًا للاختبارات، استطاع نموذج R1 تحقيق نتائج تُقارب أداء نموذج OpenAI-o1-1217 في العديد من معايير التفكير والاستدلال، ما يجعله خيارًا واعدًا للمطورين والمستخدمين على حد سواء.
نماذج صغيرة بقدرات كبيرة
قدمت DeepSeek أيضًا 6 نماذج صغيرة الحجم تتراوح بين 1.5 و70 مليار معلمة. هذه النماذج، التي تم تدريبها باستخدام 800 ألف مثال ولّدها النموذج الأكبر R1، أثبتت قدرتها على التفوق في الاستدلال على العديد من النماذج الأكبر حجمًا.
تشمل هذه النماذج الصغيرة R1-Distill-Llama-70B وR1-Distill-Qwen-32B، وهي أمثلة على تقنيات التقطير (Distillation) التي تعتمدها الشركة لتحسين الأداء مع تقليل حجم النماذج.
توفر النماذج ورخصة الاستخدام
تُتاح نماذج DeepSeek-R1 برخصة MIT، التي تسمح باستخدامها بحرية وتخصيصها لتناسب احتياجات المستخدمين. يمكن الوصول إلى هذه النماذج عبر منصات مثل GitHub وHuggingFace، بالإضافة إلى واجهات برمجية (API) تقدمها الشركة بأسعار أقل بكثير مقارنةً بنماذج OpenAI.


