أصبح وكلاء الذكاء الاصطناعي أكثر تطوراً. إنهم يتطورون من الإجابة على الأسئلة إلى التنفيذ المستقل للمهام المعقدة متعددة الخطوات.
ولكن قبل أن يتم الوثوق بهؤلاء الوكلاء لحجز الرحلات أو إجراء التحليل المالي نيابة عن المستخدمين، يرغب مقدمو النماذج والشركات الناشئة التي تبني مثل هؤلاء الوكلاء في التأكد من أنهم يؤدون أداءً موثوقًا عبر مجموعة واسعة من السيناريوهات.
غالبًا ما تستخدم مختبرات الذكاء الاصطناعي المعايير لإظهار براعة نموذجها، لكن النتيجة العالية، حتى في المعيار الموجه نحو الوكيل، لا تثبت في الواقع أن الذكاء الاصطناعي يمكنه إنجاز العديد من الوظائف المعقدة في العالم الحقيقي بشكل صحيح.
تساعد شركة Patronus AI، وهي شركة ناشئة تأسست في عام 2023 على يد باحثين سابقين في Meta AI، أناند كانابان وريبيكا تشيان، صانعي النماذج والشركات على تحسين النماذج للقيام بذلك من خلال بناء بيئات رقمية محاكاة لتقييم أداء الوكلاء.
يجب أن تحل الشركة الناشئة التي يقع مقرها في سان فرانسيسكو مشكلة مهمة. تقريبًا كل مختبرات الذكاء الاصطناعي الرائدة والعديد من الشركات الناشئة الناشئة أصبحت الآن عملاء، وفقًا لجلين سولومون، المدير الإداري في شركة Notable Capital، الذي يصف الطلب على بيئات الشركة المحاكاة بأنه لا يمكن إشباعه تقريبًا.
وقد زادت إيرادات Patronus بمقدار 15 ضعفًا خلال العام الماضي، مما أثار اهتمامًا كبيرًا من قبل المستثمرين. أعلنت الشركة يوم الخميس عن جولة من السلسلة B بقيمة 50 مليون دولار بقيادة Greenfield Partners، بمشاركة Notable Capital وLightspeed وDatadog وSamsung. وبذلك يصل إجمالي تمويل الشركة إلى 70 مليون دولار.
يستخدم Patronus ما يسميه “نماذج العالم الرقمي” لإنشاء نسخ طبق الأصل من مواقع الويب والأنظمة الداخلية. في هذه البيئات، يتم اختبار الوكلاء للضغط بعد التدريب باستخدام التعلم المعزز، والذي يكافئ بشكل متكرر إكمال المهام بنجاح ويعاقب الأخطاء.
ترى مختبرات الذكاء الاصطناعي قيمة كبيرة في عمليات المحاكاة الرقمية هذه لأنها تمنح العملاء فرصة لتجربة سيناريوهات مختلفة، لا يمكن التنبؤ بها في بعض الأحيان. تقارن الشركة نهجها بكيفية قيام Waymo بتدريب السيارات ذاتية القيادة من خلال بناء عوالم اصطناعية أولاً لاختبار المركبات ضد المخاطر النادرة، مثل الطقس القاسي أو طفل يركض خلف الكرة.
الفرق بين وكلاء الذكاء الاصطناعي هو أنهم يميلون إلى اتباع طرق مختصرة، مما يعني أنهم يفشلون في إكمال المهمة بشكل صحيح. قال سولومون: “إن باترونوس جيد حقًا في اكتشاف الاختراقات والتأكد من أنهم يحاسبون العارضات”.
تقدم شركة Patronus حاليًا عوالمها الرقمية المحاكية لهندسة البرمجيات والتمويل، ولكن هذه مجرد البداية، وفقًا لما ذكره كانابان.
وقال: “اليوم نحن نركز بشدة على المشكلات التي يمكن التحقق منها، أي المشكلات التي يمكنك فحصها والتحقق منها على الفور، ولكن هناك الكثير من المجالات التي لا يمكن التحقق منها أو يصعب التحقق منها”.
فقط لأن هذه العمليات يمكن التحقق منها لا يعني أنها بسيطة. وقال كانابان: “نريد أن نكون قادرين بالفعل على تهيئة البيئة التي يمكنك من خلالها تشغيل وكيل يمكنه العمل لمدة 10 ساعات أو 10 أيام أو 10 أسابيع”.
أما بالنسبة للمنافسين، فيعتقد باترونوس أنه يتنافس في المقام الأول ضد الفرق الداخلية التي أنشأتها مختبرات الذكاء الاصطناعي بالفعل لتقييم سلوك العميل. في حين أن شركات البيانات البشرية مثل ميركور وسيرج تساعد صانعي النماذج في التعلم المعزز، فإن باترونوس تعمل بشكل مختلف من خلال تقييم كيفية تصرف الوكلاء دون أي تدخل بشري.
عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. هذا لا يؤثر على استقلالنا التحريري.

