أعلنت Stability AI النموذج الجديد Stable Diffusion 3، وهو الإصدار الحديث والقوي من نموذج توليد الصور بالذكاء الاصطناعي.
ويأتي النموذج الجديد ردًا على النماذج المنافسة من جوجل و OpenAI.
وأصدرت Stability AI نماذج متعددة على مدار العام الماضي، ويظهر كل منها مستويات متزايدة من التطور والجودة.
وأدى إصدار SDXL في شهر يوليو إلى تحسين النموذج الأساسي Stable Diffusion بصورة كبيرة، وتتطلع الشركة الآن إلى المضي قدمًا.
ويعتمد Stable Diffusion 3 على معمارية جديدة ويعمل عبر مجموعة متنوعة من الأجهزة. ولم تصدره Stability AI بعد، مع أنه يمكنك الاشتراك في قائمة الانتظار.
ويستخدم النموذج الجديد Diffusion Transforme، وهي تقنية كانت رائدة في عام 2022 ونقحت في عام 2023 ووصلت الآن إلى قابلية التوسع.
كما أنه يستخدم Flow Matching، وهي تقنية جديدة تحسن الجودة دون إضافة الكثير من الموارد الأخرى المطلوبة لأداء مهمة محددة.
ويشير المؤسس والرئيس التنفيذي لشركة Stability AI، عماد مشتاق، إلى أن النموذج الجديد قادر على فهم الوسائط المتعددة، بالإضافة إلى إدخال الفيديو وتوليده.
ولا تزال هذه القدرات نظرية، مع أنه لا يوجد عائق تقني يحول دون تضمينها في الإصدارات المستقبلية.
ويهدف النموذج الجديد Stable Diffusion 3 إلى توفير جودة صورة محسنة وأداء أفضل في توليد الصور من مطالبات متعددة المواضيع.
ويوفر Stable Diffusion 3 أيضًا طباعة فضلى مقارنةً بنماذج Stable Diffusion السابقة، مما يتيح تهجئة دقيقة ومتسقة داخل الصور المولدة.
وكانت الطباعة نقطة ضعف في الماضي لنماذج Stable Diffusion، وهي النقطة التي كان المنافسون يعملون عليها أيضًا مع الإصدارات الأخيرة، ويشمل ذلك DALL-E 3 و Ideogram و Midjourney.
وتبني Stability AI نموذجها الجديد Stable Diffusion 3 بأحجام متعددة تتراوح بين 800 مليون معلمة و 8 مليارات معلمة، وذلك بهدف التشغيل عبر مجموعة متنوعة من الأجهزة.
وتطور Stability AI قدرات توليد الصور الثلاثية الأبعاد بالإضافة إلى إمكانات توليد الفيديو في الأشهر الأخيرة.
وقالت الشركة: “نحن نصنع نماذج مفتوحة يمكن استخدامها في أي مكان وتكييفها مع أي حاجة، وهي سلسلة من النماذج بمختلف الأحجام وتدعم تطوير نماذجنا المرئية للجيل القادم”.