تقنية توليد الفيديو متعدد الأبعاد باستخدام الذكاء الاصطناعي تحقق اختراقًا: اسقاط التكاليف، تحسين الجودة، توسيع التطبيقات

#突破 تقنيات توليد الفيديو بالذكاء الاصطناعي وتطوراتها المستقبلية

مؤخراً، كان أحد أبرز التقدمات في مجال الذكاء الاصطناعي هو الاختراق الكبير في تقنية توليد الفيديو متعدد الوسائط. لقد تطورت هذه التقنية من توليد الفيديو من النصوص فقط إلى تقنية توليد شاملة تدمج النصوص والصور والصوت.

فيما يلي بعض أمثلة التقدم التكنولوجي التي تستحق الاهتمام:

  1. الإطار EX-4D الذي أطلقته شركة تكنولوجيا معينة كمصدر مفتوح يمكنه تحويل الفيديو العادي إلى محتوى 4D بزاوية حرّة، حيث تصل نسبة قبول المستخدمين إلى 70.7%. هذه التقنية تجعل من الممكن إنشاء تجربة مشاهدة متعددة الزوايا من فيديو بزاوية واحدة، وهو ما كان يتطلب في السابق فريقاً محترفاً من نمذجة ثلاثية الأبعاد.

  2. أطلقت منصة الذكاء الاصطناعي ميزة "هوي شياو" التي يمكن أن تولد فيديو مدته 10 ثوانٍ من صورة واحدة، وتزعم أنها قادرة على تحقيق جودة "تشبه الأفلام". ومع ذلك، لا يزال دقة هذا الادعاء بحاجة إلى مزيد من التحقق.

  3. تقنية Veo التي طورتها مؤسسة أبحاث الذكاء الاصطناعي الدولية قادرة على توليد فيديو بدقة 4K وصوت بيئي بشكل متزامن. يكمن الاختراق الرئيسي لهذه التقنية في تحقيق المطابقة الحقيقية على المستوى الدلالي بين الفيديو والصوت، مثل تحقيق التطابق الدقيق بين حركة المشي في المشهد وأصوات الخطوات في المشاهد المعقدة.

  4. تمتلك تقنية ContentV الخاصة بمنصة الفيديو القصير 80 مليار معلمة، ويمكنها توليد فيديو بدقة 1080 بكسل في 2.3 ثانية، بتكلفة 3.67 يوان/5 ثوانٍ. على الرغم من أن التحكم في التكاليف جيد، إلا أن هناك مجالًا لتحسين جودة التوليد في المشاهد المعقدة.

تتمتع هذه الانجازات التقنية بأهمية كبيرة في مجالات جودة الفيديو وتكاليف الإنتاج وسيناريوهات التطبيق:

1.突破 القيمة التقنية: عادة ما ينمو تعقيد إنشاء الفيديو متعدد الأنماط بشكل متسارع. لا يتطلب الأمر فقط معالجة نقاط بكسل الصورة الواحدة (حوالي 10^6 نقطة), ولكن يجب أيضًا ضمان اتساق تسلسلي لا يقل عن 100 إطار، مع مراعاة المزامنة الصوتية (حوالي 10^4 نقطة عينة في الثانية) والتناسق المكاني ثلاثي الأبعاد. حاليًا، يتم تحقيق هذه المهمة المعقدة من خلال التفكيك إلى وحدات والتعاون بين نماذج كبيرة، مما يزيد بشكل كبير من الكفاءة.

  1. خفض التكاليف: وراء ذلك هو تحسين بنية الاستدلال، بما في ذلك استراتيجيات التوليد المتدرجة، وآليات إعادة استخدام الذاكرة المؤقتة، وتوزيع الموارد الديناميكي، وما إلى ذلك. هذه التحسينات أدت إلى خفض كبير في تكاليف توليد الفيديو.

  2. تأثير التطبيق: تكنولوجيا الذكاء الاصطناعي تغير العمليات التقليدية لإنتاج الفيديو. في الماضي، كان إعلان مدته 30 ثانية قد يتطلب مئات الآلاف من التكاليف الإنتاجية، والآن يكفي مجرد كلمة دالة و بضع دقائق من الانتظار. هذا لا يقلل فقط من العوائق التقنية والمالية لإنتاج الفيديو، بل يوفر أيضًا فرصًا أكبر للمبدعين، وقد يؤدي إلى إعادة تشكيل كاملة لاقتصاد المبدعين.

كان لهذه التغييرات تأثير عميق على تطوير تقنيات الذكاء الاصطناعي:

  1. هيكل طلب القدرة الحاسوبية قد تغير. تتطلب عملية توليد الفيديو متعدد الأنماط مجموعة متنوعة من مزيج القدرة الحاسوبية، مما يخلق طلبًا جديدًا على القدرة الحاسوبية الموزعة غير المستغلة ومجموعة متنوعة من نماذج التعديل الموزعة، والخوارزميات ومنصات الاستدلال.

  2. تعزيز متطلبات وسم البيانات. يتطلب إنتاج فيديو احترافي وصفاً دقيقاً للمشاهد، وصوراً مرجعية، وأنماط صوتية، ومسارات حركة الكاميرا، وظروف إضاءة، وغيرها من بيانات الوسم الاحترافية. توفر هذه الفرصة الجديدة للمهنيين مثل المصورين، ومهندسي الصوت، وفناني الرسوم المتحركة ثلاثية الأبعاد.

  3. زيادة الطلب على المنصات اللامركزية. تتجه تقنية الذكاء الاصطناعي من توزيع الموارد الكبير المركزي إلى التعاون القائم على الوحدات، وهذا بحد ذاته يمثل طلبًا جديدًا على المنصات اللامركزية. في المستقبل، قد تشكل قوة الحوسبة والبيانات والنماذج وآليات الحوافز حلقة تغذية راجعة تعزز ذاتيًا، مما يدفع بتقنية الذكاء الاصطناعي نحو الاندماج والتطور في مختلف المجالات.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 6
  • مشاركة
تعليق
0/400
AlgoAlchemistvip
· منذ 21 س
هل قام أي أخ منكم بتجربة هذا في فيديو؟
شاهد النسخة الأصليةرد0
BrokenYieldvip
· منذ 21 س
همم فقاعة تقنية أخرى في الطريق... لقد شهد السوق هذا الفيلم من قبل وملخصه: ينتهي بدموع
شاهد النسخة الأصليةرد0
BlockchainFoodievip
· منذ 21 س
يا، هذا الشيء الخاص بالفيديو الذكي مختلف... مثل مشاهدة واغيو نادر يتحول من نيء إلى مشوي بشكل مثالي، بصراحة.
شاهد النسخة الأصليةرد0
RugpullAlertOfficervip
· منذ 21 س
لقد هرب مستثمرين كبار الاحتيال!
شاهد النسخة الأصليةرد0
RugpullTherapistvip
· منذ 21 س
又 ثور了吧
شاهد النسخة الأصليةرد0
UnluckyLemurvip
· منذ 21 س
فيلم من الدرجة الأولى؟ صعب التحمل
شاهد النسخة الأصليةرد0
  • تثبيت