كشفت تينسنت عن نسخة جديدة من نموذج توليد الفيديو بالذكاء الاصطناعي المفتوح المصدر DynamiCrafter.
ويعد الإعلان بمنزلة تذكير بأن بعض شركات التكنولوجيا الكبرى في الصين تكثف جهودها لإحداث تغيير في مجال تحويل النصوص والصور إلى فيديو.
ويستخدم نموذج توليد الفيديو بالذكاء الاصطناعي المفتوح المصدر من عملاقة الإنترنت الصينية المعروفة بإمبراطورية ألعاب الفيديو وتطبيق الدردشة وي تشات طريقة الانتشار لتحويل التسميات التوضيحية والصور الثابتة إلى مقاطع فيديو مدتها ثوانٍ، بطريقة مشابهة لأدوات توليد الفيديو الأخرى الموجودة في السوق.
وتستطيع نماذج الانتشار تحويل البيانات البسيطة إلى بيانات معقدة وواقعية بطريقة مستوحاة من ظاهرة الانتشار الطبيعية في الفيزياء، وذلك على غرار كيفية انتقال الجسيمات من منطقة ذات تركيز عالٍ إلى منطقة أخرى ذات تركيز منخفض.
وتنتج النسخة الجديدة من نموذج تينسنت DynamiCrafter مقاطع فيديو بدقة قدرها 640×1024 بكسل، مما يعد بمنزلة ترقية مقارنةً بالنسخة السابقة الصادرة في شهر أكتوبر التي تضمنت مقاطع فيديو بدقة قدرها 320×512 بكسل.
وتشير ورقة أكاديمية نشرها فريق تينسنت إلى أن تقنية DynamiCrafter تختلف عن تلك الخاصة بالمنافسين من ناحية أنها توسع إمكانية تطبيق تقنيات الصور المتحركة على المحتوى المرئي العمومي.
وتقول الورقة البحثية: “تتعلق الفكرة الأساسية بالاستفادة من الحركة السابقة لنماذج الانتشار التي تحول النص إلى فيديو من خلال إدماج الصورة في العملية التوليدية بصفتها توجيهًا”.
وتركز التقنيات التقليدية على تحريك المشاهد الطبيعية باستخدام ديناميكيات عشوائية، مثل السحب والسوائل، أو حركات خاصة بمجال معين، مثل شعر الإنسان أو حركات الجسم.
وتبدو نتيجة نموذج تينسنت حيوية مقارنةً بنتائج النماذج الأخرى في العرض التوضيحي الذي يقارن بين DynamiCrafter و Stable Video Diffusion و Pika Labs.
وحظيت مقاطع الفيديو المولدة بالذكاء الاصطناعي بآمال كبيرة بصفتها النقطة المحورية التالية في سباق الذكاء الاصطناعي بعد ازدهار توليد النصوص والصور.
ومن المتوقع أن تضخ الشركات الناشئة وشركات التكنولوجيا الموارد في هذا المجال، ولا تعد الصين استثناءً.
وأصدرت كل من بايت دانس وبايدو وعلي بابا نماذج توليد الفيديو بالذكاء الاصطناعي. وفتحت علي بابا مصدر نموذجها لتوليد الفيديو VGen بطريقة مماثلة لشركة تينسنت.
وتحظى هذه الإستراتيجية بشعبية متزايدة بين شركات التكنولوجيا الصينية التي تأمل في الوصول إلى مجتمع المطورين العالمي.