إن خيال AI-RAN الحالي لشركة الاتصالات مغرٍ، لكن الواقع عبارة عن فخ هندسي واقتصادي مكلف
هناك رواية مغرية تجتاح صناعة الاتصالات في الوقت الحالي. يعد بأنه إذا قمنا بتغذية ما يكفي من البيتابايت من السجلات والتتبعات وبيانات التكوين في نموذج محول ضخم، فسنولد “نموذج أساس الشبكة”. الوعد هو عقل مركزي يفهم الشبكة بالطريقة التي يفهم بها GPT-4 اللغة.
في الوقت نفسه، قيل لنا أن “AI-RAN” سوف يحل مشاكل تحقيق الدخل لدينا. النظرية هي أنه يمكننا تشغيل هذا الدماغ على نفس وحدات معالجة الرسومات المستخدمة في الراديو وبيع السعة الخاملة لمن يدفع أعلى سعر.
إنها رؤية مقنعة. وهو أيضاً فخ هندسي واقتصادي.
وبينما يسارع المشغلون إلى نشر H100s على الحافة وتدريب 100 مليار نموذج معلمة، نحتاج إلى التوقف مؤقتًا وفحص المبادئ الأولى. عندما تتخلص من هذه الضجة وتنظر إلى الفيزياء واقتصاديات الوحدة، تظهر ثلاثة عيوب قاتلة: فجوة الفيزياء والاحتمالات المتوطنة في ماجستير إدارة الأعمال، وضريبة الانجراف للنماذج المتجانسة، ومغالطة الارتباط للبنية التحتية المشتركة.
هذا هو السبب في أن مستقبل Telco AI ليس نموذجًا إلهيًا. إنه صندوق أدوات متواضع.
فجوة الفيزياء والاحتمالات
الخطأ الأساسي في أطروحة “نموذج أساس الشبكة” هو الخلط بين اللغة والبنية التحتية.
نماذج الأساس هي محركات احتمالية. إنهم يتوقعون الرمز المميز التالي في تسلسل بناءً على الاحتمالية الإحصائية. في عالم الكتابة الإبداعية أو برامج الدردشة الآلية، يعد التخمين الإحصائي ميزة. ويسمى الإبداع.
لكن الشبكة عبارة عن آلة حتمية تحكمها الفيزياء، مثل انتشار الترددات اللاسلكية، والبروتوكولات الصارمة مثل معايير 3GPP. في هندسة الشبكات، التخمين الإحصائي الذي يبدو معقولًا ولكنه خاطئ في الواقع لا يعد إبداعًا. إنه انقطاع.
إذا كان نموذج الأساس يهلوس معلمة توجيه BGP لأنها تشبه إحصائيًا تكوينًا من عام 2022، فإن نصف قطر الانفجار يكون كارثيًا. نحن لسنا بحاجة إلى نموذج ذلك التخمينات حالة الشبكة بناءً على بيانات التدريب. نحن بحاجة إلى نظام ذلك مقاسات الدولة على أساس الواقع.
يجادل مؤيدو النماذج الأساسية بأن الوكلاء بطيئون للغاية بالنسبة للطبقة المادية (تشكيل الشعاع، والكفاءة الطيفية). إنهم على حق. وكلاء ليسوا لردود الفعل. سوف نعيد النظر في هذا لاحقا.
ولكن هذا هو بالضبط سبب فشل نموذج الأساس. يحاول أن يكون كل شيء. منعكس المللي ثانية و مخطط على مستوى الدقيقة.
- الطبقة المادية (L1) يحتاج إلى نماذج حتمية صغيرة وفائقة السرعة (ردود الفعل).
- طبقة الإدارة يحتاج إلى التفكير والتنسيق (الوكيل).
إذا حاولت تدريب نموذج عملاق على القيام بالأمرين معًا، فستحصل على نظام بطيء جدًا بالنسبة للفيزياء وعرضة للهلوسة جدًا للتخطيط.
ضريبة الانجراف
ويرى المؤيدون أن هذه النماذج يمكن ضبطها بدقة. لكن هذا يتجاهل تكلفة التشابك.
يقوم النموذج الأساسي المتجانس بضغط المعرفة الخاصة بالشبكة بأكملها، بما في ذلك Core وRAN والنقل والفوترة، في مساحة كامنة واحدة عالية الأبعاد. المشكلة هي أن الشبكات كائنات حية. نقدم طيفًا جديدًا وبائعي المبادلة وبرامج التصحيح أسبوعيًا.
عندما تتغير الشبكة، ينجرف النموذج. في بنية متجانسة، تؤدي إعادة التدريب أو الضبط الدقيق لهوائي 5G الجديد إلى خطر النسيان الكارثي. هذا هو المكان الذي يخفض فيه النموذج أداءه في تنبؤات الشبكة الأساسية لأنه تعلم معلمة راديو جديدة.
وهذا يخلق ضريبة الانجراف الدائمة. سيضطر المشغلون إلى الاختيار بين تشغيل نماذج قديمة أو دفع تكاليف حسابية ضخمة لإعادة التحقق من صحة النظام المتشابك باستمرار. إنها إعادة ضبط المصنع في كل مرة تحتاج فيها إلى تغيير قطعة غيار.
مغالطة الارتباط AI-RAN
ربما يكون الافتراض الاقتصادي الأكثر خطورة هو الحالة التجارية لـ AI-RAN ووضع وحدات معالجة الرسومات في موقع الخلية.
الملعب بسيط: قم بتشغيل RAN على وحدة معالجة الرسومات. عندما لا تكون الشبكة مشغولة، قم ببيع الحوسبة الخاملة لشركات الذكاء الاصطناعي للاستدلال عليها.
يعتمد هذا على افتراض أن الطلب على الشبكة والطلب على الذكاء الاصطناعي يرتبطان بشكل سلبي. أما الواقع فهو عكس ذلك.
- ذروة الشبكة: من 7:00 مساءً إلى 11:00 مساءً (البث المباشر والألعاب).
- ذروة الذكاء الاصطناعي للمستهلك: من 7:00 مساءً إلى 11:00 مساءً (روبوتات الدردشة، المساعدون الشخصيون، الترفيه).
نحن نواجه تصادم الارتباط الإيجابي. على وجه التحديد، عندما يتمكن المشغلون من بيع سعة وحدة معالجة الرسومات الخاصة بهم مقابل أعلى سعر، ستقوم وحدة التحكم في الشبكة بتأمين 100% من الموارد اللازمة لتكوين الشعاع للتعامل مع اندفاع Netflix.
يتم ترك المشغلين بسعة 3:00 صباحًا. في السوق السحابية، هذه ليست حوسبة متميزة. إنه مثيل فوري يتم تداوله مقابل أجر ضئيل مقابل الدولار مقارنة بالتوافر الموثوق. يعد الاستثمار في البنية التحتية المتطورة لكسب إيرادات السوق الفورية نموذجًا تجاريًا فاشلاً. أنت تنفق Edge Dollars لكسب Cloud Pennies.
في محادثاتي مع المشغلين، أعتقد أن الاتجاه قد تحول من “وحدة معالجة الرسومات المشتركة” (الاستخدام المتزامن) نحو “الأجهزة المقسمة”.
العمارة الواقعية الناشئة هي:
- قم بتشغيل الشبكة على ASICs/وحدات المعالجة المركزية: استخدم السيليكون المخصص الرخيص (Marvell وNokia ReefShark وIntel Granite Rapids) لشبكة RAN. إنها موفرة للطاقة وموثوقة.
- قم بتشغيل الذكاء الاصطناعي على خوادم الحافة المخصصة: إذا كان لديك عميل B2B الذي يحتاج في الواقع الذكاء الاصطناعي ذو زمن الوصول المنخفض (على سبيل المثال، المصنع)، وضع خادم منفصل في الموقع.
- لا تخلطهم: يعد تعقيد جدولة حمل العمل المختلط (حيث تعني الحزمة المسقطة مكالمة تم إسقاطها) مرتفعًا جدًا بالنسبة للإيرادات الهامشية لبيع حوسبة 3 صباحًا.
الطريق إلى الأمام: صندوق الأدوات الوكيل
إذا كان نموذج الإله المتجانس فخًا، فما هو البديل؟
أطروحتي الناشئة هي الذكاء الاصطناعي الفعال.
بدلاً من محاولة تدريب عقل واحد للقيام بكل شيء، يجب علينا أن ننظر إلى الذكاء الاصطناعي باعتباره مقاولًا عامًا (LLM) يدير صندوق الأدوات (النماذج المتخصصة).
- الدماغ (المنسق): نحن نستخدم LLMs القياسية والجاهزة للتعامل مع النوايا. يقوم LLM بترجمة طلب بشري، مثل “تحسين زمن الاستجابة لهذه الشريحة”، إلى خطة.
- الأدوات (الفيزياء): لا ينفذ LLM التغيير. ويطلق على أداة حتمية. يمكن أن يكون هذا استعلام SQL تم التحقق منه، أو جهاز محاكاة فيزيائي، أو نموذج XGBoost صغير ومتخصص تم تدريبه خصيصًا لهذا النوع من الهوائي.
وهذا يحل مشكلة السلامة. إذا هلوس ماجستير إدارة الأعمال (LLM) واستدعى الأداة الخاطئة، فستقوم الأداة بإلقاء خطأ. يفشل النظام بصوت عالٍ وبأمان، بدلاً من تنفيذ تكوين مزيف بصمت.
كما أنه يحل مشكلة الانجراف. إذا قمت بتغيير بائع الهوائي الخاص بك، فإنك لا تقوم بإعادة تدريب الدماغ. ما عليك سوى تبديل “أداة الهوائي” المحددة. بقية النظام البيئي لا يزال على حاله.
خاتمة
تتمتع صناعة الاتصالات بتاريخ من الحلول الهندسية المفرطة لمشاكل البرامج. نحن نفعل ذلك مرة أخرى.
نحن نحاول إضفاء طابع أوبر على شبكة النفاذ الراديوي (RAN) بالسيارات العالقة في المرآب خلال ساعة الذروة، ونحاول التحكم في البنية التحتية الحتمية باستخدام مولدات الشعر الاحتمالية.
لن تفوز شركة اتصالات المستقبل ببناء النموذج الأكبر. سوف يفوز من خلال بناء الهندسة المعمارية الأكثر وحدات. لقد حان الوقت للتوقف عن محاولة حفظ الإنترنت والبدء في إنشاء آلة حاسبة أفضل.

