DeepSeek تطلق نماذج R1 بأداء ينافس نماذج o1 من OpenAI
أعلنت شركة DeepSeek الصينية إطلاق نموذجين جديدين للذكاء الاصطناعي، هما R1 و R1-Zero، مدّعيةً أنهما يضاهيان أداء نماذج التفكير المنطقي o1 من شركة OpenAI الرائدة، وهي النماذج التي تأخذ بعض الوقت في التفكير والتحليل والمقارنة والتقييم قبل توليد الإجابات.
وبالإضافة إلى ذلك، طرحت الشركة الصينية 6 نماذج مفتوحة المصدر أصغر حجمًا، بعضها ينافس أداء نموذج OpenAI-o1-mini.
ويمتاز نموذج DeepSeek-R1-Zero بطريقة تعلم مبتكرة، إذ طوّر مهاراته في الاستدلال باستخدام التعلم المعزز (Reinforcement Learning) دون الاعتماد على أمثلة بشرية. واعتمد النموذج على نظام مكافآت مبسّط وقواعد واضحة لفحص دقة الإجابات، ومنها التحقق من صحة حلول المسائل الرياضية وبرمجية التعليمات.
وطوّرت DeepSeek خوارزمية جديدة تقيّم مجموعات من الإجابات بدلًا من تقييم كل إجابة على حدة، وقد مكّنت هذه التقنية النموذج من تحسين أدائه بكفاءة.
ومع إمكانياته الواعدة، واجه النموذج مشكلتين رئيسيتين، وهما صعوبة قراءة الإجابات وخلط اللغات. ولمواجهة ذلك، أطلقت DeepSeek نموذج R1، الذي يبدأ بتدريب مبدئي على بيانات صغيرة، ثم يخضع لجولات متعددة من التعلم المعزز لتحسين الأداء.
وأظهرت الاختبارات أن نموذج DeepSeek-R1 حقق أداءً يقارب أداء نموذج OpenAI-o1-1217 عبر عدة معايير استدلالية تُختبر بها نماذج الذكاء الاصطناعي.
وطوّرت الشركة 6 نماذج صغيرة تتراوح بين 1.5 و 70 مليار معلمة، وقد استخدمت هذه النماذج 800 ألف مثال تدريبي ولّدها نموذج R1 الأكبر، وقد أظهرت النماذج الصغيرة (النماذج المُقطّرة)، مثل R1-Distill-Llama-70B و R1-Distill-Qwen-32B، قدرات استدلالية قوية، متفوقة على العديد من النماذج الأكبر حجمًا.
ويتوفر نموذج DeepSeek-R1 برخصة MIT، مما يسمح باستخدامه بحرية وتخصيصها وتطويرها. ويمكن الوصول إلى تلك النماذج عبر منصتي GitHub و HuggingFace، أو من خلال واجهة برمجية (API) خاصة بالشركة بأسعار محددة.
ويأتي هذا بعد إطلاق الشركة الصينية نموذجها DeepSeek-V3، الذي يُعدّ من أقوى النماذج المفتوحة المصدر في العالم، ومضاهيًا نماذج أخرى مثل GTP-4o.
تم نسخ الرابط