Stability AI تطلق نموذجًا مبتكرًا لتوليد الفيديو رباعي الأبعاد
أعلنت شركة Stability AI عن نموذج Stable Video 4D الذي يرتقي بتقنيات توليد الفيديو إلى مستوى جديد. يتميز النموذج الجديد بقدرته الفريدة على تحويل مقطع فيديو واحد إلى ثمانية مقاطع من زوايا مختلفة، مما يفتح آفاقًا واسعة في صناعة السينما والألعاب وتطبيقات الواقع المعزز والافتراضي.
صرح فارون جامباني، قائد فريق أبحاث الأبعاد الثلاثية في Stability AI، أن Stable Video 4D يجمع بين مزايا نموذجي Stable Video Diffusion و Stable Video 3D السابقين، مع تحسينات جوهرية باستخدام مجموعة بيانات مدروسة للأجسام ثلاثية الأبعاد المتحركة.
يعمل النموذج على أربعة أبعاد: العرض والارتفاع والعمق والزمن، مما يتيح عرض الأجسام المتحركة من زوايا متعددة وفي لحظات زمنية مختلفة.
أوضح جامباني أن Stable Video 4D يتفوق على النماذج السابقة في آليات الانتباه، حيث صُمم لتوليد كل إطار فيديو مع مراعاة الإطارات المجاورة من مختلف الزوايا والأوقات، مما ينتج تماسكًا ثلاثي الأبعاد أفضل وانسيابية زمنية في المقاطع المولدة.
يختلف هذا النهج عن تقنيات الملء التوليدي التقليدية، إذ يقوم النموذج بإنشاء المقاطع الثمانية من الصفر، مستخدمًا الفيديو الأصلي كمرجع دون نقل مباشر لبيانات الصورة.
أشار جامباني إلى أن النموذج الحالي يعالج مقاطع فيديو لأجسام منفردة لثوانٍ معدودة بخلفية بسيطة، مع خطط لتطويره ليشمل مقاطع أطول ومشاهد أكثر تعقيدًا.
Stable Video 4D متاح حاليًا للتقييم البحثي على منصة Hugging Face، بينما لم تعلن Stability AI بعد عن خططها التجارية المستقبلية للنموذج.
ذو صلة > OpenAI Sora: نموذج ذكاء اصطناعي لتحويل النص إلى فيديو