قد ينخفض سهم Nvidia بسبب نموذج الذكاء الاصطناعي “المذهل” الخاص بـ DeepSeek الذي يعطل OpenAI
وقد ساعدت السياسة الأمريكية المتمثلة في تقييد وصول الصين إلى رقائق الذكاء الاصطناعي الأكثر تقدما من إنفيديا، عن غير قصد، مطور الذكاء الاصطناعي الصيني على القفز على المنافسين الأمريكيين الذين لديهم حق الوصول الكامل إلى أحدث رقائق الشركة.
وهذا يثبت السبب الأساسي وراء نجاح الشركات الناشئة في كثير من الأحيان أكثر من الشركات الكبيرة: الندرة تولد الابتكار.
ومن الأمثلة على ذلك نموذج الذكاء الاصطناعي الصيني DeepSeek R1 – وهو نموذج معقد لحل المشكلات ينافس نموذج O1 الخاص بشركة OpenAI – والذي “وصل إلى المراكز العشرة الأولى عالميًا في الأداء” – ومع ذلك تم بناؤه بسرعة أكبر بكثير، مع عدد أقل وأقل قوة من رقائق الذكاء الاصطناعي، وبتكلفة أقل بكثير، بحسب وول ستريت جورنال.
يجب أن يفيد نجاح R1 الشركات. وذلك لأن الشركات لا ترى أي سبب لدفع المزيد مقابل نموذج فعال للذكاء الاصطناعي عندما يتوفر نموذج أرخص – ومن المرجح أن يتحسن بسرعة أكبر.
قال أنتوني بو، المؤسس المشارك لشركة ناشئة مقرها وادي السيليكون تستخدم الذكاء الاصطناعي التوليدي للتنبؤ بالعوائد المالية، إن “نموذج OpenAI هو الأفضل من حيث الأداء، لكننا أيضًا لا نريد أن ندفع مقابل القدرات التي لا نحتاجها”. مجلة.
في سبتمبر الماضي، تحولت شركة Poo من Anthropic's Claude إلى DeepSeek بعد أن أظهرت الاختبارات أن DeepSeek “كان أداؤه مشابهًا لحوالي ربع التكلفة”، حسبما أشارت الشركة. مجلة.
عندما كتابي، اندفاع الدماغ، الذي تم نشره في الصيف الماضي، كنت أشعر بالقلق من أن مستقبل الذكاء الاصطناعي التوليدي في الولايات المتحدة يعتمد بشكل كبير على أكبر شركات التكنولوجيا. لقد قارنت هذا بإبداع الشركات الناشئة الأمريكية خلال طفرة الدوت كوم – التي أنتجت 2888 طرحًا عامًا أوليًا (مقارنة بصفر اكتتابات عامة أولية لشركات الذكاء الاصطناعي الناشئة الأمريكية).
قد يؤدي نجاح DeepSeek إلى ظهور منافسين جدد لمطوري نماذج اللغات الكبيرة في الولايات المتحدة. إذا قامت هذه الشركات الناشئة ببناء نماذج ذكاء اصطناعي قوية تحتوي على عدد أقل من الرقائق وحصلت على تحسينات للسوق بشكل أسرع، فقد تنمو إيرادات Nvidia بشكل أبطأ مع قيام مطوري LLM بتكرار استراتيجية DeepSeek المتمثلة في استخدام شرائح ذكاء اصطناعي أقل وأقل تقدمًا.
لقد اتصلت بـ Nvidia وسوف أقوم بتحديث هذا المنشور إذا تلقيت تعليقًا.
DeepSeek's R1: أداء ممتاز، تكلفة أقل، وقت تطوير أقصر
لقد أثار DeepSeek إعجاب أحد كبار أصحاب رأس المال الاستثماري في الولايات المتحدة. “يعد Deepseek R1 واحدًا من أكثر الإنجازات المذهلة والمثيرة للإعجاب التي رأيتها على الإطلاق،” كتب مارك أندريسن، صاحب رأس المال الاستثماري في وادي السليكون، في منشور بتاريخ 24 يناير.
ولكي نكون منصفين، فإن تكنولوجيا DeepSeek تتخلف عن تكنولوجيا المنافسين الأمريكيين مثل OpenAI وGoogle. ومع ذلك، فإن نموذج R1 الخاص بالشركة – والذي تم إطلاقه في 20 يناير – “يعد منافسًا وثيقًا على الرغم من استخدام عدد أقل وأقل تقدمًا من الرقائق، وفي بعض الحالات تخطي الخطوات التي اعتبرها المطورون الأمريكيون ضرورية”، كما أشار. مجلة.
ونظرًا للتكلفة العالية لنشر الذكاء الاصطناعي التوليدي، تتساءل الشركات بشكل متزايد عما إذا كان من الممكن تحقيق عائد إيجابي على الاستثمار. وكما كتبت في أبريل الماضي، يمكن استثمار أكثر من تريليون دولار في التكنولوجيا، ولم يظهر بعد تطبيق قاتل.
ولذلك، فإن الشركات متحمسة بشأن احتمالات خفض الاستثمار المطلوب. وبما أن نموذج R1 مفتوح المصدر يعمل بشكل جيد وأقل تكلفة بكثير من نماذج OpenAI وGoogle، فإن الشركات مهتمة بشدة.
كيف ذلك؟ R1 هو النموذج الأكثر رواجًا الذي يتم تنزيله على HuggingFace – 109000، وفقًا لـ فينشربيت, و يطابق “O1 الخاص بـ OpenAI بنسبة تتراوح بين 3% و5% فقط من التكلفة.” كما يوفر R1 أيضًا ميزة بحث يرى المستخدمون أنها متفوقة على OpenAI وPerplexity “ولا ينافسها سوى Gemini Deep Research من Google”، كما أشار. فينشربيت.
قام DeepSeek بتطوير R1 بسرعة أكبر وبتكلفة أقل بكثير. قالت DeepSeek إنها دربت أحد أحدث نماذجها مقابل 5.6 مليون دولار – وهو أقل بكثير من النطاق الذي يتراوح بين 100 مليون ومليار دولار والذي ذكره الرئيس التنفيذي لشركة Anthropic، داريو أمودي، في عام 2024 باعتباره تكلفة تدريب نماذجها، مجلة ذكرت.
لتدريب نموذج V3 الخاص به، استخدمت DeepSeek مجموعة مكونة من أكثر من 2000 شريحة Nvidia “مقارنة بعشرات الآلاف من الرقائق لنماذج التدريب ذات الحجم المماثل”، كما أشار. مجلة.
قام محللون مستقلون من Chatbot Arena، وهي منصة يستضيفها باحثون من جامعة كاليفورنيا في بيركلي، بتصنيف نماذج V3 وR1 ضمن أفضل 10 نماذج لأداء chatbot في 25 يناير، مجلة كتب.
الرئيس التنفيذي وراء DeepSeek هو Liang Wenfeng، الذي يدير صندوق تحوط بقيمة 8 مليارات دولار. وأشار صندوق التحوط الخاص به، المسمى High-Flyer، إلى أنه استخدم رقائق الذكاء الاصطناعي لبناء خوارزميات لتحديد “الأنماط التي يمكن أن تؤثر على أسعار الأسهم”. فاينانشيال تايمز.
ساعده وضع ليانغ الخارجي على النجاح. وفي عام 2023، أطلق DeepSeek لتطوير الذكاء الاصطناعي على المستوى البشري. قال أحد المؤسسين في شركة LLM منافسة: “لقد قام ليانغ ببناء فريق بنية تحتية استثنائي يفهم حقًا كيفية عمل الرقائق”. فاينانشيال تايمز. “لقد أخذ معه أفضل موظفيه من صندوق التحوط إلى DeepSeek.”
استفادت شركة DeepSeek عندما منعت واشنطن شركة Nvidia من تصدير H100s – أقوى رقائق شركة Nvidia – إلى الصين. وقد أجبر ذلك شركات الذكاء الاصطناعي المحلية على الالتفاف حول ندرة قوة الحوسبة المحدودة للرقائق المحلية الأقل قوة مثل Nvidia H800s، وفقًا لـ سي ان بي سي. وأشار إلى أن فريق ليانج “يعرف بالفعل كيفية حل هذه المشكلة”. فاينانشيال تايمز.
مايكروسوفت معجبة جدًا بإنجازات DeepSeek. قال الرئيس التنفيذي ساتيا ناديلا في 22 كانون الثاني (يناير) في المؤتمر: “إن رؤية نموذج DeepSeek الجديد، أمر مثير للإعجاب للغاية من حيث كيفية قيامهم بفعالية بنموذج مفتوح المصدر يقوم بحساب وقت الاستدلال هذا، وهو ذو كفاءة فائقة في الحوسبة”. المنتدى الاقتصادي العالمي. “يجب أن نأخذ التطورات خارج الصين على محمل الجد للغاية.”
هل سيؤدي اختراق DeepSeek إلى إبطاء نمو الطلب على شرائح Nvidia؟
من المفترض أن يؤدي نجاح DeepSeek إلى تحفيز التغييرات في سياسة الذكاء الاصطناعي الأمريكية مع جعل مستثمري Nvidia أكثر حذراً.
تضع قيود التصدير الأمريكية إلى Nvidia ضغوطًا على الشركات الناشئة مثل DeepSeek لإعطاء الأولوية للكفاءة وتجميع الموارد والتعاون. لإنشاء R1، أعادت DeepSeek تصميم عملية التدريب الخاصة بها لاستخدام سرعة المعالجة الأقل لـ Nvidia H800s – نصف سرعة H100s، حسبما قال زيهان وانغ، الموظف السابق في DeepSeek وطالب الدكتوراه الحالي في علوم الكمبيوتر في جامعة نورث وسترن. مراجعة تكنولوجيا معهد ماساتشوستس للتكنولوجيا.
كان أحد الباحثين في Nvidia متحمسًا لإنجازات DeepSeek. أعاد تقرير DeepSeek الذي أبلغ عن النتائج ذكريات برامج الذكاء الاصطناعي الرائدة التي أتقنت ألعاب الطاولة مثل الشطرنج والتي تم بناؤها “من الصفر، دون تقليد أساتذة البشر أولاً”، كما قال جيم فان، كبير علماء الأبحاث في Nvidia، على موقع X كما هو موضح في مجلة.
هل سيؤدي نجاح DeepSeek إلى خنق معدل نمو Nvidia؟ لا أعلم. ومع ذلك، بناءً على بحثي، من الواضح أن الشركات تريد نماذج ذكاء اصطناعي توليدية قوية تؤتي ثمارها. وبينما تسعى الشركات إلى الحصول على تطبيقات ذكاء اصطناعي توليدية عالية المردود، فإنها ستكون قادرة على إجراء المزيد من التجارب إذا كانت التكلفة والوقت اللازمين لبناء هذه التطبيقات أقل.
ولهذا السبب فإن تكلفة R1 المنخفضة والوقت الأقصر للأداء الجيد يجب أن يستمر في جذب المزيد من الاهتمام التجاري. إن مفتاح قدرة DeepSeek على تقديم ما تريده الشركات هو مهارتها في تحسين وحدات معالجة الرسوميات الأقل قوة – والتي تكلف أقل من أحدث الرقائق.
إذا تمكنت المزيد من الشركات الناشئة من تكرار ما أنجزته DeepSeek، فقد يكون هناك طلب أقل على أغلى شرائح Nvidia.
لا أعرف كيف سترد Nvidia في حالة حدوث ذلك. ومع ذلك، على المدى القصير، قد يعني ذلك نموًا أقل في الإيرادات حيث تقوم الشركات الناشئة التي تتبع استراتيجية DeepSeek ببناء نماذج تحتوي على عدد أقل من الرقائق ذات الأسعار المنخفضة.