Công nghệ tạo video đa mô hình AI đã có bước đột phá: Thả chi phí Tăng chất lượng Mở rộng ứng dụng

Đột phá và phát triển tương lai của công nghệ tạo video AI

Gần đây, một trong những tiến bộ đáng chú ý nhất trong lĩnh vực AI là sự đột phá lớn trong công nghệ tạo video đa phương thức. Công nghệ này đã phát triển từ việc chỉ tạo video từ văn bản đơn thuần, thành công nghệ tạo ra một cách toàn diện tích hợp văn bản, hình ảnh và âm thanh.

Dưới đây là một số trường hợp tiến bộ công nghệ đáng chú ý:

  1. Khung EX-4D mã nguồn mở của một công ty công nghệ có thể chuyển đổi video thông thường thành nội dung 4D với góc nhìn tự do, tỷ lệ người dùng chấp nhận lên tới 70,7%. Công nghệ này cho phép tạo ra trải nghiệm xem đa góc từ video góc nhìn đơn, điều mà trước đây cần phải có đội ngũ mô hình 3D chuyên nghiệp để thực hiện.

  2. Một nền tảng AI có chức năng "Hội tưởng" có thể tạo ra một video dài 10 giây từ một bức ảnh đơn, tuyên bố có thể đạt được chất lượng "phim điện ảnh". Tuy nhiên, độ chính xác của tuyên bố này vẫn cần được xác minh thêm.

  3. Công nghệ Veo do một tổ chức nghiên cứu AI quốc tế phát triển có khả năng đồng bộ tạo ra video 4K và âm thanh môi trường. Bước đột phá quan trọng của công nghệ này nằm ở việc đạt được sự khớp chính xác về mặt ngữ nghĩa giữa video và âm thanh, chẳng hạn như trong các cảnh phức tạp, việc thực hiện các hành động đi bộ trong hình ảnh tương ứng chính xác với âm thanh bước chân.

  4. Công nghệ ContentV của một nền tảng video ngắn có 8 tỷ tham số, có thể tạo ra video 1080p trong 2,3 giây với chi phí là 3,67 nhân dân tệ/5 giây. Mặc dù việc kiểm soát chi phí khá tốt, nhưng vẫn còn không gian để cải thiện chất lượng tạo ra trong các cảnh phức tạp.

Các đột phá công nghệ này có ý nghĩa quan trọng trong các lĩnh vực như chất lượng video, chi phí sản xuất và các tình huống ứng dụng:

  1. Đột phá giá trị kỹ thuật: Độ phức tạp của việc tạo video đa mô hình thường tăng theo cấp số nhân. Nó không chỉ cần xử lý các điểm ảnh của hình ảnh đơn lẻ (khoảng 10^6 điểm), mà còn phải đảm bảo tính liên tục theo thời gian của ít nhất 100 khung hình, đồng thời phải xem xét sự đồng bộ âm thanh (khoảng 10^4 điểm mẫu mỗi giây) và tính nhất quán không gian 3D. Hiện tại, nhiệm vụ phức tạp này được thực hiện thông qua việc phân tách mô-đun và hợp tác giữa các mô hình lớn, nâng cao đáng kể hiệu quả.

  2. Giảm chi phí: Đằng sau là tối ưu hóa kiến trúc suy luận, bao gồm chiến lược tạo sinh phân lớp, cơ chế tái sử dụng bộ nhớ đệm và phân bổ tài nguyên động. Những tối ưu hóa này đã làm giảm đáng kể chi phí tạo video.

  3. Ảnh hưởng ứng dụng: Công nghệ AI đang thay đổi quy trình sản xuất video truyền thống. Trước đây, một quảng cáo dài 30 giây có thể tốn hàng trăm nghìn chi phí sản xuất, giờ đây chỉ cần một từ gợi ý và vài phút chờ đợi. Điều này không chỉ giảm bớt rào cản về công nghệ và tài chính trong sản xuất video, mà còn mang lại nhiều khả năng hơn cho các nhà sáng tạo, có thể dẫn đến việc tái cấu trúc toàn bộ nền kinh tế sáng tạo.

Những thay đổi này đã có ảnh hưởng sâu sắc đến sự phát triển của công nghệ AI:

  1. Cấu trúc nhu cầu tính toán đã thay đổi. Việc tạo video đa mô hình cần một sự kết hợp tính toán đa dạng, điều này tạo ra nhu cầu mới cho sức mạnh tính toán nhàn rỗi phân tán cũng như các mô hình tinh chỉnh phân tán, thuật toán và nền tảng suy diễn khác nhau.

  2. Nhu cầu ghi nhãn dữ liệu tăng cường. Việc tạo ra video chuyên nghiệp cần mô tả cảnh chính xác, hình ảnh tham khảo, phong cách âm thanh, đường đi của máy ảnh và điều kiện ánh sáng cùng với các ghi nhãn dữ liệu chuyên nghiệp khác. Điều này mang đến cơ hội mới cho các chuyên gia như nhiếp ảnh gia, kỹ sư âm thanh và nghệ sĩ 3D.

  3. Nhu cầu về nền tảng phi tập trung ngày càng tăng. Công nghệ AI đang dần chuyển từ phân bổ tài nguyên quy mô lớn tập trung sang hợp tác mô-đun, điều này chính là nhu cầu mới cho nền tảng phi tập trung. Trong tương lai, sức mạnh tính toán, dữ liệu, mô hình và cơ chế khuyến khích có thể hình thành một vòng lặp tự củng cố tích cực, thúc đẩy sự hòa nhập và phát triển của công nghệ AI trong các lĩnh vực khác nhau.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 6
  • Chia sẻ
Bình luận
0/400
AlgoAlchemistvip
· 21giờ trước
Có anh em nào làm video đã thử cái này chưa?
Xem bản gốcTrả lời0
BrokenYieldvip
· 21giờ trước
hmm một bong bóng công nghệ khác đang hình thành... thị trường đã thấy bộ phim này trước đây và phần kết: nó kết thúc bằng nước mắt
Xem bản gốcTrả lời0
BlockchainFoodievip
· 21giờ trước
Này, cái video AI này thật khác biệt... như xem một miếng wagyu hiếm hoi biến đổi từ sống sang được nướng hoàn hảo, không nói dối.
Xem bản gốcTrả lời0
RugpullAlertOfficervip
· 21giờ trước
Kẻ lừa đảo Nhà đầu tư lớn đều đã Rug Pull rồi!
Xem bản gốcTrả lời0
RugpullTherapistvip
· 21giờ trước
Lại khoe tuyệt vời rồi hả
Xem bản gốcTrả lời0
UnluckyLemurvip
· 21giờ trước
Phim điện ảnh? Khó nhằn
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)