تطرح OpenAI برنامج شراكة جديد لجمع مجموعات البيانات من أطراف خارجية من أجل استخدامها لتدريب نماذجها للذكاء الاصطناعي.
وتسعى مبادرة “شراكات بيانات OpenAI” إلى الحصول على معلومات خاصة وعامة واسعة النطاق، التي تشير إلى أنه لا يمكن للعامة الوصول إليها بسهولة عبر الإنترنت.
وتوضح الشركة أن البيانات التي تجمعها لا يجب بالضرورة أن تكون كمية أو في تنسيقات نصية، إذ يقبل البرنامج أيضًا الصور أو الصوت أو الفيديو.
وتبحث الشركة عن بيانات بشأن أي موضوع وبأي لغة طالما أنها تعبر عن النية الإنسانية، وهو ما تشبهه بالمقالات الطويلة أو المحادثات المكتوبة.
ويتوقع أن تساعد البيانات التي تركز على الإنسان والتي تجمعها OpenAI في تحسين أدوات الشركة، مثل تقنية تعرف الكلام التي تستخدم لنسخ الكلمات المنطوقة.
موضوعات ذات صلة بما تقرأ الآن:
وتتوافق هذه المبادرة أيضًا مع التوسع الأخير لروبوت الدردشة ChatGPT لدعم الاستعلامات الصوتية للتفاعل مع المستخدمين بطريقة محادثة.
ويؤدي تعامل نماذج الشركة للذكاء الاصطناعي للمزيد من المعلومات التي تعلمها كيفية إجراء المحادثات الشبيهة بالإنسان إلى تحسين هذه الميزة والأدوات الأخرى التي تتبع في الوظيفة.
كما يؤدي اختبار النموذج الذي أجرته OpenAI عبر برنامج شراكة البيانات إلى توسيع قدرات نموذج GPT-4 Turbo الموجهة للمستهلك، التي حدثتها الشركة لتزويد المستخدمين باستجابات معقدة وذات معنى.
وتشير OpenAI إلى أنها بدأت العمل مع المنظمات المهتمة، ومنها الهيئات الرسمية، مثل الحكومة الأيسلندية، إذ تُحسن مجموعات البيانات المنسقة قدرة GPT-4 على فهم الاستعلامات المقدمة باللغة الأيسلندية.
وتستطيع المؤسسات الخاصة والعامة المشاركة في البرنامج من خلال تقديم نموذج عبر موقع الشركة ومشاركة المعلومات حول نوع البيانات التي تريد مشاركتها وحجمها.
وتوضح الشركة أن مجموعات البيانات قد تكون أرشيفًا مفتوح المصدر، وهو مثالي لمجموعات البيانات ذات الصلة بنماذج لغة التدريب.
كما يمكن للمؤسسة تقديم المعلومات من خلال مسار مجموعة بياناتها الموجهة لتدريب نماذجها للذكاء الاصطناعي، التي تشير الشركة إلى أنها تتضمن النماذج التأسيسية والنماذج المضبوطة والمخصصة.
ويوصى بهذا المسار للشركات أو المؤسسات الراغبة في الحفاظ على سرية بياناتها، وتشير OpenAI إلى أنها لا تبحث عن مجموعات البيانات المتضمنة معلومات حساسة أو شخصية.
وسجل ChatGPT أرقامًا قياسية لقاعدة المستخدمين المتزايدة، ولديه نحو 100 مليون مستخدم نشط أسبوعيًا حول العالم، مما يعني أن الخصوصية قد تظل نقطة محورية للأداة.