تطرح OpenAI إصدارًا جديدًا من ChatGPT Images الذي يعد بمتابعة أفضل للتعليمات، وتحرير أكثر دقة، وسرعات إنشاء صور أسرع تصل إلى 4x.
النموذج الجديد، المسمى GPT-Image-1.5، متاح بدءًا من يوم الثلاثاء لجميع مستخدمي ChatGPT وعبر واجهة برمجة التطبيقات (API). إنه أحدث تصعيد في المنافسة مع Gemini من Google بعد أن أعلن Sam Altman، الرئيس التنفيذي لشركة OpenAI، الشهر الماضي عن “الرمز الأحمر” في مذكرة داخلية مسربة. توضح المذكرة بالتفصيل خطط OpenAI لاستعادة مكانتها كرائدة في مجال الذكاء الاصطناعي بعد أن بدأت Google في الاستحواذ على حصة في السوق، بعد إصدار Gemini 3، أحدث طراز رئيسي لها، وNano Banana Pro، أحدث إصدار من منشئ الصور الفيروسية من Google – وكلاهما تصدرا قائمة صدارة LMArena عبر معايير متعددة.
تحافظ Google على ريادتها حتى بعد استجابة OpenAI لنجاحها الأسبوع الماضي بإطلاق GPT-5.2، مما يجعلها النموذج الأكثر تقدمًا حتى الآن للمطورين والاستخدام المهني اليومي. وبحسب ما ورد كانت شركة OpenAI تخطط لإصدار مولد صور جديد في أوائل شهر يناير، مما أدى إلى تسريع هذه الخطط بإعلان هذا الأسبوع. آخر إصدار لنموذج الصورة كان GPT-Image-1 في أبريل.
يأتي GPT-Image-1.5 مع تقدم مولدات الصور والفيديو إلى ما هو أبعد من النماذج الأولية واكتساب المزيد من القدرات الجاهزة للإنتاج. مثل Nano Banana Pro، توفر ChatGPT Images ميزات ما بعد الإنتاج، مما يوفر المزيد من عناصر التحكم الدقيقة في التحرير للحفاظ على الاتساق البصري، مثل شكل الوجه والإضاءة والتكوين ودرجة الألوان عبر التعديلات.
معظم أدوات صور GenAI سيئة في التكرار، لذلك ستكون هذه خطوة كبيرة للأمام. عندما يُطلب من النموذج إجراء تغيير محدد، مثل “ضبط تعبيرات الوجه” أو “جعل الإضاءة أكثر برودة”، غالبًا ما يعيد النموذج تفسير الصورة بأكملها، مما يؤدي إلى عدم الاتساق.
لا يقتصر التحديث على الميزات الجديدة فقط. كتب Fidji Simo، الرئيس التنفيذي للتطبيقات في OpenAI، في منشور بالمدونة يوم الثلاثاء، أنه سيتم الآن الوصول إلى صور ChatGPT أيضًا عبر نقطة دخول مخصصة في الشريط الجانبي لـ ChatGPT الذي يعمل “أشبه باستوديو إبداعي”.
كتب سيمو: “تسهل شاشات عرض الصور وتحريرها الجديدة إنشاء صور تتوافق مع رؤيتك أو الحصول على الإلهام من المطالبات الشائعة والمرشحات المعدة مسبقًا”.
حدث تك كرانش
سان فرانسيسكو
|
13-15 أكتوبر 2026
بالإضافة إلى منشئ الصور الجديد، تقدم OpenAI طرقًا جديدة لتحسين تجربة ChatGPT من خلال المزيد من العناصر المرئية. تتمثل الخطة في جعل استعلامات البحث تعرض المزيد من العناصر المرئية بمصادر واضحة، مما قد يكون مفيدًا لمهام مثل تحويل القياسات أو التحقق من النتائج الرياضية، وفقًا لـ Simo.
“عندما تقوم بالإبداع، يجب أن تكون قادرًا على رؤية وتشكيل الشيء الذي تصنعه. عندما تحكي العناصر المرئية قصة أفضل من الكلمات وحدها، يجب أن يتضمنها ChatGPT،” كتب سيمو. “عندما تحتاج إلى إجابة سريعة أو تكون الخطوة التالية موجودة في أداة أخرى، فيجب أن تكون هناك. وبينما نفعل ذلك، يمكننا الاستمرار في تقريب المسافة بين ما يدور في ذهنك وقدرتك على جلبه إلى الحياة.”

