بدأ السباق لإطلاق نماذج عالمية حيث انضمت شركة Runway لتوليد الصور والفيديو التي تعمل بتقنية الذكاء الاصطناعي إلى عدد متزايد من الشركات الناشئة وشركات التكنولوجيا الكبرى من خلال إطلاق أول نموذج لها. وقالت الشركة إن النموذج الذي يطلق عليه اسم GWM-1، يعمل من خلال التنبؤ إطارًا بإطار، وإنشاء محاكاة بفهم للفيزياء وكيف يتصرف العالم فعليًا بمرور الوقت.
النموذج العالمي هو نظام ذكاء اصطناعي يتعلم محاكاة داخلية لكيفية عمل العالم حتى يتمكن من التفكير والتخطيط والتصرف دون الحاجة إلى التدريب على كل سيناريو ممكن في الحياة الواقعية.
وقالت شركة Runway، التي أطلقت في وقت سابق من هذا الشهر نموذج الفيديو Gen 4.5 الذي تجاوز كلاً من Google وOpenAI في لوحة المتصدرين Video Arena، إن نموذجها العالمي GWM-1 أكثر “عموما” من Genie-3 من Google والمنافسين الآخرين. وتقوم الشركة بالترويج لها كنموذج يمكنه إنشاء عمليات محاكاة لتدريب العملاء في مجالات مختلفة مثل الروبوتات وعلوم الحياة.
“لبناء نموذج عالمي، كنا بحاجة أولاً إلى بناء نموذج فيديو رائع حقًا. نعتقد أن الطريق الصحيح لبناء نموذج عالمي هو أن تعليم النماذج للتنبؤ بالبكسلات بشكل مباشر هو أفضل طريقة لتحقيق محاكاة للأغراض العامة. وقال أناستاسيس جيرمانيديس، كبير مسؤولي التكنولوجيا في الشركة، خلال البث المباشر: “على نطاق كافٍ وباستخدام البيانات الصحيحة، يمكنك بناء نموذج يتمتع بفهم كافٍ لكيفية عمل العالم”.
أصدرت Runway اتجاهات أو إصدارات محددة للنموذج العالمي الجديد المسمى GWM-Worlds وGWM-Robotics وGWM-Avatars.
GWM-Worlds هو تطبيق للنموذج يتيح لك إنشاء مشروع تفاعلي. يمكن للمستخدمين تعيين مشهد من خلال موجه أو مرجع صورة، وأثناء استكشافك للمساحة، يقوم النموذج بإنشاء العالم بفهم للهندسة والفيزياء والإضاءة. وذكرت الشركة أن المحاكاة تعمل بمعدل 24 إطارًا في الثانية وبدقة 720 بكسل. قال Runway إنه على الرغم من أن لعبة Worlds قد تكون مفيدة للألعاب، إلا أنها أيضًا في وضع جيد لتعليم العملاء كيفية التنقل والتصرف في العالم المادي.
من خلال GWM-Robotics، تهدف الشركة إلى استخدام البيانات الاصطناعية المعززة بمعلمات جديدة مثل الظروف الجوية المتغيرة أو العوائق. يقول موقع Runway إن هذه الطريقة يمكن أن تكشف أيضًا متى وكيف قد تنتهك الروبوتات السياسات والتعليمات في سيناريوهات مختلفة.
حدث تك كرانش
سان فرانسيسكو
|
13-15 أكتوبر 2026
تقوم Runway أيضًا ببناء صور رمزية واقعية ضمن GWM-Avatars لمحاكاة السلوك البشري. لقد عملت شركات مثل D-ID وSynthesia وSoul Machines وحتى Google على إنشاء صور رمزية بشرية تبدو حقيقية وتعمل في مجالات مثل الاتصالات والتدريب.
لاحظت الشركة أن العوالم والروبوتات والصور الرمزية هي نماذج منفصلة من الناحية الفنية، لكنها تخطط في النهاية لدمج كل هذه النماذج في نموذج واحد.
إلى جانب إطلاق نموذج عالمي جديد، تعمل الشركة أيضًا على تحديث نموذج Gen 4.5 الأساسي الذي تم إصداره في وقت سابق من الشهر. يوفر التحديث الجديد إمكانات الصوت الأصلي وقدرات توليد اللقطات الطويلة والمتعددة للنموذج. وقالت الشركة إنه باستخدام هذا النموذج، يمكن للمستخدمين إنشاء مقاطع فيديو مدتها دقيقة واحدة مع اتساق الشخصية والحوار الأصلي وصوت الخلفية واللقطات المعقدة من زوايا مختلفة. قالت الشركة أنه يمكنك أيضًا تعديل الصوت الموجود وإضافة الحوارات. بالإضافة إلى ذلك، يمكنك تحرير مقاطع الفيديو متعددة اللقطات بأي طول.
يعمل تحديث Gen 4.5 على دفع Runway إلى الاقتراب من مجموعة الفيديو الكل في واحد من منافس Kling، والتي تم إطلاقها أيضًا في وقت سابق من هذا الشهر، لا سيما حول الصوت الأصلي وسرد القصص متعدد اللقطات. كما يشير أيضًا إلى أن نماذج توليد الفيديو تنتقل من النموذج الأولي إلى الأدوات الجاهزة للإنتاج. يتوفر طراز Gen 4.5 المحدث من Runway لجميع مستخدمي الخطة المدفوعة.

وقالت الشركة إنها ستجعل GWM-Robotics متاحة من خلال SDK. وأضافت أنها تجري محادثات نشطة مع العديد من شركات الروبوتات والمؤسسات لاستخدام GWM-Robotics وGWM-Avatars.

