تجارة الذكاء الاصطناعي تتجه إلى ما هو أبعد من وحدات معالجة الرسومات

على مدى العامين الماضيين، كانت تجارة الذكاء الاصطناعي تدور حول رهان واحد مهيمن: الطلب على وحدات معالجة الرسومات اللازمة لتدريب نماذج أكبر من أي وقت مضى. والآن، مع بدء الشركات في استخدام أدوات الذكاء الاصطناعي في العالم الحقيقي، بدأ المستثمرون في النظر إلى ما هو أبعد من طفرة التدريب نحو البنية التحتية المطلوبة لتشغيل تلك الأنظمة بشكل مستمر على نطاق واسع.
وهذا يضع وحدات معالجة الرسومات، أو وحدات معالجة الرسومات، في دائرة الضوء.
يمكن لهذه الرقائق التعامل مع العديد من العمليات الحسابية في وقت واحد، مما يجعلها ضرورية لتدريب نماذج الذكاء الاصطناعي الكبيرة. نظرًا لأن وحدات معالجة الرسومات تتطلب بنية تحتية مادية واسعة النطاق للعمل على نطاق واسع، فإن الاندفاع لتأمين الرقائق سرعان ما أصبح صراعًا من أجل مساحة مركز البيانات، والوصول إلى الطاقة والسعة الأوسع.
استجاب المستثمرون من خلال ضخ الأموال في الشركات التي دعمت هذا البناء بأكمله. من الواضح أن أداء هذه التجارة كان جيدًا ومن المحتمل أن يكون لديها مجال للتشغيل. وبينما يتطلع السوق إلى ما هو أبعد من طفرة التدريب، فقد تبدأ مجموعة الفرص في الاتساع.
والسبب هو أن نماذج الذكاء الاصطناعي لا تخلق قيمة كبيرة بمجرد وجودها. إنهم يفعلون ذلك فقط عندما يستخدمها الأشخاص والشركات. وهذا ينقل المناقشة من التدريب إلى الاستدلال، وهو عملية تشغيل النماذج المدربة للإجابة على الأسئلة أو إكمال المهام أو تطبيقات الطاقة. بالنسبة للمستثمرين، فإن الفرق ليس أكاديميا.
يحتاج التدريب إلى قوة حاسوبية هائلة أثناء بناء النماذج. وعلى النقيض من ذلك، يعتمد الاستدلال على القدرة الثابتة مع انتشار الذكاء الاصطناعي من خلال البحث والبرمجيات وخدمة العملاء والترميز ومهام سير العمل الأخرى. يؤدي ذلك إلى إعادة وحدات المعالجة المركزية (CPUs)، أو وحدات المعالجة المركزية، إلى المناقشة لأنها تساعد في تنسيق النشاط عبر الحوسبة.
وهذا من شأنه أن يمثل تحولا ملحوظا. كانت وحدات المعالجة المركزية لفترة طويلة هي العمود الفقري للحوسبة قبل أن تستحوذ وحدات معالجة الرسومات على الأضواء أثناء طفرة التدريب. الآن، قد يكون لوحدات المعالجة المركزية دور أكبر مرة أخرى، ليس عن طريق استبدال وحدات معالجة الرسومات، ولكن من خلال المساعدة في إدارة التدفق المستمر لعمل الذكاء الاصطناعي الذي يتم تشغيله عبر الخوادم والأنظمة الأساسية السحابية ومراكز البيانات.
تكلفة تشغيل نماذج الذكاء الاصطناعي يمكن أن تجعل مرحلة الاستدلال أكثر إلحاحا بالنسبة للمستثمرين. الرموز هي الأجزاء الصغيرة من النص أو البيانات التي يستخدمها نموذج الذكاء الاصطناعي لإنشاء استجابة. مع تحسن الأجهزة، يبدو أن الشركات تنتج كل رمز بتكلفة أقل، مما يسمح للرقائق باهظة الثمن بالقيام بمزيد من العمل.
وفي الوقت نفسه، من المرجح أن يرتفع الطلب على الرموز المميزة مع تزايد انتشار عوامل الذكاء الاصطناعي. بدلاً من الإجابة على سؤال واحد والتوقف، يمكن للوكلاء العمل من خلال عدة خطوات قبل إكمال المهمة. يمكن أن يؤدي ذلك إلى زيادة الاستخدام عبر أنظمة الذكاء الاصطناعي.
هذا المزيج مهم بالنسبة للمقياس الفائق. إذا انخفضت تكاليف الرمز المميز مع نمو الاستخدام واستمرار الأسعار، فقد تكسب الشركات التي تبني البنية التحتية للذكاء الاصطناعي انتشارًا أوسع. في هذه الحالة، يبدأ الإنفاق على الرقائق ومراكز البيانات والطاقة في الظهور بشكل أقل كرهان مضاربة وأكثر شبهاً كأساس لشركة تشغيل أكبر.
ويظهر هذا الطلب الأوسع بالفعل في الطريقة التي تصف بها شركات الرقائق سوق الاستدلال. لقد سلطت كل من Intel وArm الضوء على الدور المتزايد لوحدات المعالجة المركزية مع زيادة الاستدلال. قالت إنتل، على سبيل المثال، إن تكوينات خادم الذكاء الاصطناعي يمكن أن تتحول من حوالي ثماني وحدات معالجة رسوميات لكل وحدة معالجة مركزية إلى حوالي أربع وحدات معالجة رسوميات لكل وحدة معالجة مركزية مع تزايد الطلب على الاستدلال. إذا ثبتت دقة هذه التوقعات، فإنها ستدعم النقطة الأوسع: الاستدلال يمكن أن يدفع إنفاق الذكاء الاصطناعي إلى ما هو أبعد من وحدات معالجة الرسومات، وإلى وحدات المعالجة المركزية والخوادم والأنظمة اللازمة لتشغيل النماذج على نطاق واسع.
قد تصبح الخوادم أيضًا أكثر أهمية. يمكن لأكبر المتوسعين الفائقين تصميم أنظمة مخصصة والعمل مباشرة مع الموردين العالميين. غالبًا ما يحتاج مقدمو الخدمات السحابية الصغيرة والسحابات الجديدة المصممة للاستدلال إلى معدات يمكنهم نشرها بسرعة ودعمها بسهولة. وقد يساعد ذلك شركات مثل Dell وHPE، التي تبيع الخوادم التي تحمل أعباء عمل الذكاء الاصطناعي.
والجدير بالذكر أن العديد من الشركات لا تزال تستعد لاستخدام الذكاء الاصطناعي على نطاق أوسع. إنهم بحاجة إلى تنظيف البيانات وربط الأنظمة قبل أن يتمكنوا من نشر الوكلاء عبر أعمالهم. يستغرق هذا العمل وقتًا، لكنه يشير أيضًا إلى أن الطلب على الاستدلال يمكن أن يستمر في التزايد مع انتقال المزيد من الشركات من الإعداد إلى الاستخدام الحقيقي.
في نهاية المطاف، هذه ليست حجة ضد التجارة التي تعتمد على GPU. إنها حجة مفادها أن الاستدلال يمكن أن ينشر المرحلة التالية من الإنفاق على الذكاء الاصطناعي عبر مجموعة أوسع من الشركات. إذا كانت النماذج ستعمل بشكل مستمر عبر مسارات عمل حقيقية، فسوف يحتاج المستثمرون إلى النظر إلى ما هو أبعد من الشركات التي قامت بتدريبهم ونحو الشركات التي تحافظ على استمرارهم.



