كشفت شركة ميتا اليوم الأربعاء عن نموذج جديد للذكاء الاصطناعي قادر على اختيار كائنات فردية من الصور، كما كشفت عن مجموعة بيانات لشروحات الصور يُقال إنها الكبرى من نوعها على الإطلاق.
وقال قسم الأبحاث في الشركة في منشور على مدونتها إن (نموذج تجزئة أي شيء) Segment Anything Model أو (إس أي إم) SAM، قادر على تحديد الأشياء في الصور ومقاطع الفيديو حتى في الحالات التي لم يصادف فيها هذه الكائنات في تدريبه.
وباستخدام (نموذج تجزئة أي شيء)، يمكن تحديد الكائنات من خلال النقر عليها أو كتابة مطالبات نصية لذلك. وفي أحد العروض التوضيحية، دفعت كتابة كلمة «قطة» الأداة إلى رسم مربعات حول كل قطة موجودة في الصورة.
ومنذ إطلاق شركة (أوبن أي آي) OpenAI، التي تدعمها مايكروسوفت، روبوت الدردشة (شات جي بي تي) ChatGPT في خريف 2022، اندفعت شركات التقنية الكبرى للتركيز في الذكاء الاصطناعي مع موجة من الاستثمارات وسباق للسيطرة على هذا المجال.
موضوعات ذات صلة بما تقرأ الآن:
وبدورها، كشفت ميتا عن العديد من الميزات التي توظف نوعًا من الذكاء الاصطناعي التوليدي، الذي أشاعه روبوت الدردشة (شات جي بي تي)، والذي يُنشئ محتوى جديدًا تمامًا بدلًا من مجرد تحديد أو تصنيف البيانات، مثل: الذكاء الاصطناعي التقليدي. ومع ذلك، لم تُطلق الشركة أي منتج بعد.
وتتضمن الأمثلة: أداة قادرة على إنتاج مقاطع فيديو «واقعية» من توجيهات نصية، وأداة أخرى تنشئ رسومًا لكتب الأطفال من النص الخاص بها.
وقال الرئيس التنفيذي لشركة ميتا (مارك زوكربيرج) إن إدماج مثل هذه «الوسائل الإبداعية» للذكاء الاصطناعي في تطبيقات ميتا يمثل أولوية هذا العام.
وتستخدم ميتا بالفعل تقنية مشابهة لـ (نموذج تجزئة أي شيء) داخليًا لأنشطة، مثل: وضع علامات على الصور، وتقييد المحتوى المحظور، وتحديد المنشورات التي يجب التوصية بها لمستخدمي فيسبوك، وإنستاجرام.
وقالت الشركة إن إطلاق (نموذج تجزئة أي شيء) سيوسع الوصول إلى هذا النوع من التقنية. كما قالت إن النموذج ومجموعة البيانات سيتوفران للتنزيل بموجب الترخيص غير التجاري. وبالمثل، يجب على المستخدمين، الذين يُحمِّلون صورهم الخاصة إلى النموذج الأولي المصاحب، الموافقة على استخدامها لأغراض البحث فقط.