تعمل سلسلة Mixture-of-Experts الجديدة على إطار عمل Huawei MindSpore مفتوح المصدر
خلاصة القول – ما نعرفه:
سلسلة TeleChat3 ــ أصدرت شركة TeleAI التابعة لشركة China Telecom أول نماذج واسعة النطاق من مزيج من الخبراء تم تدريبها بالكامل على أشباه الموصلات المصممة محلياً.
كومة الأجهزة المحلية – تم إجراء التدريب حصريًا على شرائح Ascend 910B AI من Huawei وإطار عمل MindSpore مفتوح المصدر، للتحقق من جدوى النظام البيئي المحلي.
وضع التفكير – تقدم النماذج آلية “التفكير” التي تجعل عمليات التفكير قابلة للتتبع، بهدف تحسين المنطق والدقة في المهام المعقدة.
قد لا تتمكن الصين من الوصول إلى بعض الأجهزة المصممة في الولايات المتحدة بالسهولة التي تريدها، لكنها لا تزال قادرة بشكل واضح على تطوير نماذج لغوية كبيرة ومتطورة. قامت شركة TeleAI، ذراع أبحاث الذكاء الاصطناعي لشركة China Telecom، بفتح المصدر لسلسلة TeleChat3 من نماذج اللغات الكبيرة، والتي تعد أول نماذج خليط من الخبراء واسعة النطاق في الصين يتم تدريبها بالكامل على أشباه الموصلات المصممة محليًا.
إنها مشكلة كبيرة إلى حد ما بالنسبة لجهود الذكاء الاصطناعي المحلية في الصين. كان الوصول إلى Nvidia وغيرها من وحدات معالجة الرسومات المصممة في الولايات المتحدة أمرًا صعبًا بالنسبة للشركات الصينية في أحسن الأحوال، ولكن يبدو كما لو أنه من الممكن أن تدعم مجموعة الذكاء الاصطناعي المحلية في الصين تطوير النماذج على نطاق واسع.
نموذج ضخم
تشتمل مجموعة TeleChat3 على العديد من أحجام النماذج، حيث يكون الطراز الرئيسي TeleChat3-105B-A4.7B-Thinking – وهو عبارة عن بنية MoE دقيقة الحبيبات تحتوي على 105 مليار معلمة. يسلط اصطلاح التسمية الضوء على أن 4.7 مليار معلمة فقط يتم تنشيطها أثناء أي تمريرة استدلال معينة، وهي الميزة الأساسية لتصاميم وزارة التربية والتعليم. يمكنك الحصول على أداء عالٍ دون تحمل الحمل الحسابي لتشغيل نموذج كثيف على هذا النطاق. هناك أيضًا TeleChat3-36B-Thinking، وهي بنية كثيفة من المحتمل أن تقدم مقايضات مختلفة اعتمادًا على احتياجات النشر.
تم التدريب في البنية التحتية للحوسبة في شنغهاي لينغانغ، حيث استهلكت النماذج 15 تريليون رمز على طول الطريق. تعمل المجموعة بأكملها على شرائح Ascend 910B AI من Huawei المقترنة بإطار عمل MindSpore للتعلم العميق – وهو مشروع آخر طورته Huawei، وهو مفتوح المصدر. تحرص شركة China Telecom على التأكيد على التوافق الكامل مع النظام البيئي الأوسع لشركة Huawei Ascend، بما في ذلك خوادم التدريب Ascend Atlas800T A2. وفقًا للشركة، تعاملت أجهزة هواوي مع “المتطلبات الشديدة” لتدريب وزارة التربية على نطاق واسع، على الرغم من عدم مشاركة التفاصيل حول كفاءة التدريب، أو معدلات الفشل، أو كيفية مواجهة كل هذا مع أجهزة Nvidia.
وكانت شركة China Telecom، التي طورت النموذج، أول شركة اتصالات تتبنى DeepSeek – ولكن من المنطقي أن تتطلع الشركة إلى بناء نموذجها الخاص بدلاً من ذلك.
“وضعية التفكير”
إحدى الميزات الموجودة في TeleChat3 تسمى “وضع التفكير” – وهي آلية تعرض عملية التفكير الخاصة بالنموذج للمستخدمين. يعمل التنفيذ من خلال رموز إرشادية محددة في قوالب الحوار، مما يدفع النموذج إلى إنشاء خطوات تفكير وسيطة قبل إنتاج إجابة نهائية. يبدو هذا مشابهًا إلى حد كبير لتقنيات تحفيز سلسلة الأفكار التي أصبحت ممارسة قياسية في هذا المجال، على الرغم من أن شركة China Telecom تضعها كقدرة معمارية متميزة.
الهدف هو أداء أفضل في المهام المعقدة التي تنطوي على الاستنتاج المنطقي. تشير شركة China Telecom إلى مسائل المعرفة، والتفكير الرياضي، وإنشاء المحتوى، وتوليد الأكواد، وتطبيقات الوكيل الذكي باعتبارها مجالات يجب أن يحقق فيها وضع التفكير هذا المزايا. تدعي الشركة أن الأداء عبر ستة أبعاد أساسية تقترب من “المستويات الدولية المتقدمة”. ومع ذلك، لم تظهر أي مقارنات معيارية مباشرة ضد GPT-5 أو كلود، لذا فإن هذه الادعاءات تستحق بعض الشك حتى تظهر تقييمات الطرف الثالث.
الجغرافيا السياسية
لا توجد طريقة لفهم إصدار TeleChat3 دون النظر إلى الخلفية الجيوسياسية. لقد أدت العقوبات الأمريكية إلى حرمان شركتي تشاينا تيليكوم وهواوي من أشباه الموصلات المتقدمة المصنعة باستخدام التكنولوجيا الأمريكية، الأمر الذي دفع قطاع التكنولوجيا في الصين إلى تسريع العمل على بدائل قابلة للتطبيق. TeleChat3 هو أول تأكيد عام من مطور صيني على أن تدريب وزارة التعليم على نطاق واسع يمكن أن يحدث بالفعل على الرقائق المحلية وحدها. لكي نكون واضحين، تم تخفيف بعض عمليات الحظر المفروضة على صادرات الرقائق إلى الصين، لكن هذه الرقائق لا تزال غير متاحة بسهولة، وتأتي بسعر مرتفع.
ومن الصعب أن نجزم بما إذا كان هذا يرقى إلى الاكتفاء الذاتي التكنولوجي الحقيقي أو إلى حل بديل يحمل تكاليف خفية. جادل منتقدو جهود الصين في مجال أشباه الموصلات بأن رقائق هواوي لا تزال أقل كفاءة من أحدث أجهزة إنفيديا، ومن المحتمل أن تتطلب المزيد من السيليكون، والمزيد من الطاقة، والمزيد من الوقت لتحقيق نتائج مماثلة. ولم تصدر شركة تشاينا تيليكوم أي نوع من المقارنات التفصيلية التي من شأنها أن تسمح لأي شخص بتقييم هذه المقايضات بشكل مستقل.
ويندرج هذا الإصدار أيضًا ضمن مبادرة “الذكاء الاصطناعي +” الأوسع في الصين – وهي حملة تدعمها الحكومة لنشر الذكاء الاصطناعي عبر قطاعات مثل الخدمات الحكومية والاتصالات والطاقة والتمويل. يبدو أن TeleChat3 جزء من هذا الجهد، حيث يقدم نموذجًا منتجًا محليًا يتجنب الاعتماد على التكنولوجيا الأجنبية للتطبيقات الحساسة.
وفي خروج عن بعض مشاريع الذكاء الاصطناعي الصينية الأخرى، أتاحت شركة China Telecom أوزان النموذج وكود الاستدلال وأمثلة الاستخدام على GitHub وModelScope. إن التحول إلى المصادر المفتوحة يفتح الباب أمام الباحثين الأكاديميين والمطورين التجاريين على حد سواء، مما قد يؤدي إلى تسريع اعتمادها مع تمكين درجة ما من التدقيق المستقل. وبطبيعة الحال، يبقى أن نرى مدى قوة الجذب التي تكتسبها هذه النماذج خارج الصين.

