AI video generation bước vào kỷ nguyên đa phương thức Web3 có thể trở thành người hưởng lợi lớn nhất

robot
Đang tạo bản tóm tắt

Công nghệ tạo video AI đạt được bước đột phá lớn, tích hợp đa mô hình trở thành xu hướng mới

Gần đây, tiến bộ đáng chú ý nhất trong lĩnh vực AI chính là sự đột phá của công nghệ tạo video đa phương thức. Công nghệ này đã phát triển từ việc tạo video từ văn bản đơn lẻ sang giải pháp tạo toàn bộ tích hợp văn bản, hình ảnh và âm thanh.

Một vài trường hợp đột phá đáng chú ý:

  1. Khung EX-4D mã nguồn mở của một công ty công nghệ có thể chuyển đổi video thông thường thành nội dung 4D với góc nhìn tự do, tỷ lệ chấp nhận của người dùng lên tới 70,7%. Công nghệ này cho phép xem video từ bất kỳ góc độ nào, điều mà trước đây cần phải có đội ngũ mô hình 3D chuyên nghiệp mới có thể thực hiện.

  2. Một nền tảng AI tuyên bố rằng tính năng "vẽ tưởng" của nó có thể chuyển đổi một bức ảnh thành video chất lượng "phim" dài 10 giây. Tuy nhiên, tính xác thực của tuyên bố này vẫn cần được xác minh.

  3. Công nghệ Veo do một tổ chức nghiên cứu AI nổi tiếng phát triển có thể đồng bộ tạo ra video 4K và âm thanh môi trường. Công nghệ này đã vượt qua thách thức về việc đồng bộ hóa hình ảnh và âm thanh trong các cảnh phức tạp, chẳng hạn như sự khớp chính xác giữa hành động đi bộ trong hình ảnh và âm thanh bước chân.

  4. Công nghệ ContentV của một nền tảng video ngắn có 80 tỷ thông số, có thể tạo ra video 1080p trong vòng 2.3 giây, với chi phí là 3.67 nhân dân tệ/5 giây. Mặc dù việc kiểm soát chi phí khá tốt, nhưng vẫn còn có không gian để cải thiện chất lượng sản xuất trong các cảnh phức tạp.

Những bước đột phá công nghệ này có ý nghĩa quan trọng trong các khía cạnh như chất lượng video, chi phí sản xuất và các tình huống ứng dụng:

Đầu tiên, độ phức tạp kỹ thuật của việc tạo video đa mô hình đang tăng trưởng theo cấp số nhân. Nó không chỉ phải xử lý các điểm pixel của hình ảnh đơn lẻ (khoảng 10^6 điểm), mà còn phải đảm bảo tính liên tục theo thời gian của video (ít nhất 100 khung hình), đồng thời còn phải xem xét sự đồng bộ âm thanh (10^4 điểm mẫu mỗi giây) và tính nhất quán trong không gian 3D. Hiện nay, nhiệm vụ phức tạp này có thể được thực hiện thông qua việc phân chia theo mô-đun và hợp tác giữa các mô hình lớn, từ đó nâng cao hiệu quả rất nhiều.

Thứ hai, việc giảm đáng kể chi phí là nhờ vào việc tối ưu hóa kiến trúc suy diễn, bao gồm các chiến lược sinh cấp bậc, cơ chế tái sử dụng bộ nhớ đệm và phân bổ tài nguyên động. Những tối ưu hóa này đã giúp một số nền tảng kiểm soát chi phí tạo video ở mức thấp.

Cuối cùng, những đột phá công nghệ này đã gây ra cú sốc lớn cho ngành sản xuất video truyền thống. Công nghệ AI đã đơn giản hóa quy trình vốn cần nhiều thiết bị, địa điểm, diễn viên và hậu kỳ, chỉ còn lại việc nhập từ gợi ý và chờ vài phút. Điều này không chỉ giảm bớt rào cản về công nghệ và tài chính trong sản xuất video, mà còn có thể đạt được những góc nhìn và hiệu ứng mà quay phim truyền thống khó có thể thực hiện, có khả năng dẫn đến một vòng tái cấu trúc mới trong nền kinh tế sáng tạo.

Những thay đổi này cũng đã có tác động sâu sắc đến lĩnh vực Web3 AI:

  1. Cấu trúc nhu cầu sức mạnh tính toán đã thay đổi. Việc tạo video đa mô hình cần sự kết hợp sức mạnh tính toán đa dạng, điều này tạo ra nhu cầu mới cho sức mạnh tính toán nhàn rỗi phân tán cũng như các loại mô hình tinh chỉnh phân tán, thuật toán và nền tảng suy diễn.

  2. Nhu cầu ghi nhãn dữ liệu tăng cường. Việc tạo ra video chuyên nghiệp cần có mô tả cảnh chính xác, hình ảnh tham khảo, phong cách âm thanh, đường đi của máy quay và điều kiện ánh sáng cùng các dữ liệu chuyên môn khác. Cơ chế khuyến khích của Web3 có thể khuyến khích các nhiếp ảnh gia, kỹ sư âm thanh và các nghệ sĩ 3D cung cấp tài liệu dữ liệu chất lượng cao, từ đó nâng cao khả năng tạo video AI.

  3. Nhu cầu về nền tảng phi tập trung ngày càng tăng. Công nghệ AI đang dần chuyển từ việc phân bổ tài nguyên quy mô lớn tập trung sang hợp tác theo mô-đun, điều này tự nó tạo ra nhu cầu mới cho nền tảng phi tập trung. Trong tương lai, sức mạnh tính toán, dữ liệu, mô hình và cơ chế khuyến khích có thể hình thành một vòng lặp tích cực tự củng cố, thúc đẩy sự hòa nhập sâu sắc giữa các cảnh Web3 AI và Web2 AI.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 2
  • Chia sẻ
Bình luận
0/400
GateUser-4745f9cevip
· 07-27 22:09
Nhịp độ của cuộc chiến giữa các thần tiên.
Xem bản gốcTrả lời0
WagmiWarriorvip
· 07-25 04:31
Cách mạng sản xuất lực đã được tái tạo.
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)