Bứt phá trong vòng hai ba năm tới! Đồng sáng lập FaceWall Intelligence, Lý Đại Hải: Hướng tương tác người-máy thế hệ mới đã xuất hiện ánh sáng

robot
Đang tạo bản tóm tắt

Khi trí tuệ nhân tạo bắt đầu chuyển từ màn hình sang thế giới thực, tương tác người-máy đang trải qua một giai đoạn nâng cấp.

Dù là điện thoại, ô tô hay robot và thiết bị đeo đang dần phổ biến, các hình thức tương tác theo lượt dựa trên hỏi đáp truyền thống đang dần bộc lộ các vấn đề như phản hồi chậm, cảm nhận bị chia rẽ, gián đoạn ngữ cảnh. Những nhược điểm vốn có của phương thức tương tác này đang trở thành rào cản chính để AI tiến vào thế giới vật lý.

Ngày 2 tháng 2, đồng sáng lập kiêm CEO của 面壁智能 (Mianbi Zhìnéng) Lý Đại Hải đã trả lời phỏng vấn của các phương tiện truyền thông, trong đó có phóng viên của 《每日经济新闻》, cho biết hướng đi của tương tác người-máy thế hệ mới đã xuất hiện ánh sáng, nhưng sự chuyển đổi thực sự sẽ không xảy ra trong một lần mà sẽ dần dần diễn ra cùng với việc nâng cao khả năng của các mô hình đám mây và tại điểm cuối. Trong quá trình này, liệu mô hình đa dạng toàn diện có thể trở thành bộ não thể hiện kết nối giữa trí tuệ số và thế giới vật lý hay không, đang trở thành vấn đề cốt lõi được ngành công nghiệp quan tâm.

Hình ảnh nguồn: 面壁智能

Toàn mô hình không phải là cộng gộp chức năng, mà là thay đổi trong phương thức tương tác

Khi AI bắt đầu bước vào thế giới vật lý, và khi nó điều khiển robot hoặc thiết bị đeo, các mô hình tương tác người-máy truyền thống bắt đầu bộc lộ nhược điểm.

Giáo sư dài hạn của Khoa Máy tính tại Đại học Thanh Hoa, đồng sáng lập kiêm nhà khoa học trưởng của 面壁智能, Lưu Triều Viễn cho rằng, đối với con người, nghe, nói, nhìn vốn là các kênh đa luồng song song, con người có thể vừa nói vừa nghe, vừa nhìn mà không gây cản trở lẫn nhau. Nhưng về mặt tương tác người-máy, phần lớn các mô hình trước đây rất khó có khả năng này, “một khi bạn bắt đầu nói, thì không thể nhìn nữa, có những vấn đề này nọ.”

Nhược điểm của phương thức tương tác này hạn chế khả năng tiến sâu của AI vào trí tuệ thể hiện. Theo Lưu Triều Viễn, khả năng tương tác nhân hóa, tự nhiên cao là bước quan trọng để robot và các thiết bị thông minh trở nên giống con người hơn. “Nó (mô hình toàn diện) và việc giúp robot, thiết bị thông minh trong tương lai có thể tương tác tự nhiên như con người, có thể gần hơn.”

Dựa trên nhận định này, trí tuệ thể hiện không phải là một nhánh độc lập, mà là một kịch bản ứng dụng yêu cầu cao hơn về khả năng tương tác của mô hình. Lưu Triều Viễn nhấn mạnh, trong các kịch bản như thể hiện và thiết bị thông minh, thực ra cũng cần các mô hình tương tự, để có thể phục vụ con người tốt hơn. Trong cuộc phỏng vấn, ông dự đoán, sự tiến bộ nhanh chóng của trí tuệ thể hiện có thể không còn xa nữa. “Nếu nói còn bao lâu, tôi ước chừng chỉ trong vòng hai ba năm tới.”

Về mặt ngành công nghiệp, sự kết hợp giữa mô hình tại điểm cuối và phần cứng AI đang trở thành một đề bài thực tế và phức tạp.

Theo Lý Đại Hải, cùng với các tập đoàn lớn tham gia, các thể loại thông minh tiến vào điện thoại và các thiết bị cuối khác, hình thái tương tác người-máy thế hệ mới đã xuất hiện ánh sáng, nhưng điều này không có nghĩa là điểm ngoặt đã đến. Ông dự đoán, sự chuyển đổi này sẽ không hoàn tất trong một lần, “mọi người sẽ liên tục khám phá theo hướng này, điều này cần đi kèm với việc nâng cao liên tục của các mô hình đám mây và tại điểm cuối.”

Ngay cả trong các kịch bản điện thoại hiện đang được thảo luận rộng rãi, công nghệ vẫn còn những hạn chế rõ rệt. Lý Đại Hải cho biết, ví dụ như điện thoại Doubao dựa trên một trong những mô hình tốt nhất trong ngành, nhưng khả năng hoàn thành các nhiệm vụ phức tạp của con người của nó thực tế vẫn chưa đạt trạng thái lý tưởng có thể sử dụng.

Lý Đại Hải phân tích thêm, một mặt, các giải pháp dựa trên đám mây thuần túy khó tránh khỏi các vấn đề về quyền riêng tư; mặt khác, tiêu hao năng lượng của tài nguyên tại điểm cuối như sức mạnh tính toán khiến việc triển khai khả năng toàn diện trên điện thoại cần nhiều thời gian hơn. Ông thẳng thắn nói, càng nhiều mô hình, tiêu hao tài nguyên càng lớn, điều này quyết định tốc độ phát triển của các dạng thiết bị khác nhau.

Hiện tại, tương tác trên điện thoại chủ yếu dựa vào giọng nói và cảm ứng, các mô hình còn hạn chế. Lý Đại Hải giới thiệu, lấy điện thoại Doubao làm ví dụ, đột phá cốt lõi là giúp thể thông minh có thể thao tác điện thoại như con người, thay thế người dùng hoàn thành các nhiệm vụ phức tạp, tương đương với việc giải quyết vấn đề xuất ra như con người. Hướng phát triển tiếp theo quan trọng là cách nhập liệu.

“Hiện tại, đồng bộ ngữ cảnh giữa điện thoại và con người dựa vào thao tác chủ động trên màn hình. Nếu trong tương lai, điện thoại có thể trực tiếp nghe, xem thế giới thực, nó sẽ có thể đồng bộ và chia sẻ ngữ cảnh tốt hơn với chủ nhân.” Lý Đại Hải cho rằng, đây là bước quan trọng để điện thoại tiến tới trở thành thể thông minh thực sự, nhưng cũng sẽ đối mặt với thách thức kép về tiêu thụ năng lượng và bảo vệ quyền riêng tư, đặt ra yêu cầu cao hơn đối với thiết kế sản phẩm.

Ngược lại, các kịch bản như ô tô, robot, do điều kiện tài nguyên rộng rãi hơn, cũng được Lý Đại Hải xem là hướng triển khai tiềm năng hơn của mô hình toàn diện. Trong lĩnh vực trí tuệ thể hiện, ông cho rằng, điểm nghẽn hiện tại không nằm ở bản thể, mà ở bộ não. Một khi khả năng của mô hình có bước đột phá, trí tuệ thể hiện có khả năng bước vào giai đoạn chuyển đổi tương tự như “ChatGPT thời điểm”.

Ngành công nghiệp sẽ nhanh chóng chứng kiến sự bùng nổ về khả năng chuyên môn và tương tác của mô hình

Dựa trên nhận định này, 面壁智能 không tập trung quá nhiều vào một sản phẩm hoặc dạng phần cứng cụ thể nào, mà là khả năng liên tục tạo ra các mô hình chất lượng cao.

Trong lĩnh vực AI, quy luật mở rộng (Scaling Law) từng là quy luật bất biến, nhưng tranh luận về việc liệu nó có thể gặp giới hạn vẫn chưa dừng lại. 面壁智能 từng đề xuất một góc nhìn khác: Quy luật mật độ (Densing Law), tức là tuổi thọ của các mô hình lớn rất ngắn, khả năng của chúng tăng gấp đôi mỗi khoảng 100 ngày. Điều này có nghĩa, điều quan trọng không phải là phát triển ra một mô hình xuất sắc, mà là khả năng liên tục phát triển các mô hình xuất sắc.

面壁智能 tự định vị là “bộ khắc mô hình lớn”. Lý Đại Hải giải thích, bộ khắc này là liên tục huấn luyện ra các mô hình có khả năng mật độ cao hơn.

Lưu Triều Viễn bổ sung, logic của quy luật mật độ tương tự như ngành công nghiệp chip: xu hướng của các mô hình lớn trong tương lai là ngày càng nhỏ hơn, mật độ ngày càng cao. Từ đó, giảm tối đa chi phí mô hình, đồng thời dùng kích thước nhỏ hơn để chúng có khả năng chạy trên các thiết bị gần người dùng hơn.

Lý Đại Hải nhấn mạnh, thương mại hóa mô hình tại điểm cuối cũng là một phần của việc xác nhận khả năng và vòng quay dữ liệu. Chỉ dựa vào con đường thương mại để bán mô hình, nhằm mục tiêu triển khai mô hình trên hàng tỷ thiết bị có thể khá khó khăn, con đường thực tế hơn là thúc đẩy quá trình này qua hệ sinh thái và các nhà phát triển.

Về cạnh tranh với các tập đoàn lớn, Lý Đại Hải cho rằng, cơ hội của các công ty khởi nghiệp chưa biến mất vì sự tham gia của các tập đoàn lớn. AI vẫn là một cơ hội mang tính ngành, thử thách đối với các công ty khởi nghiệp là chọn chiếm lĩnh một phần nhỏ trong một lĩnh vực rộng lớn, hay tranh giành vị trí hàng đầu trong thị trường nhỏ hơn, “Tôi tin còn rất nhiều không gian để mọi người thể hiện.”

Về xu hướng công nghệ trong tương lai, Lưu Triều Viễn đề xuất hai chủ đạo: thứ nhất là khả năng thông minh liên tục tăng cường; thứ hai là việc sử dụng trí tuệ hiệu quả liên tục. Ông cho rằng, trong một đến hai năm tới, ngành sẽ nhanh chóng chứng kiến khả năng chuyên môn của các mô hình ngày càng mạnh mẽ, cùng với sự bùng nổ trong khả năng tương tác với thế giới. “Nó (mô hình) như một thể thông minh, có khả năng tự học mạnh mẽ hơn, đây là xu hướng phát triển rất quan trọng trong một đến hai năm tới. Khi nó có khả năng tự khám phá, học hỏi và trưởng thành, bước đột phá tiếp theo chính là sự hợp tác của nhiều thể thông minh.”

Lưu Triều Viễn nói rằng, trong năm đến mười năm tới, toàn cầu chắc chắn sẽ bước vào trạng thái liên kết, kết nối cao của nhiều thể thông minh, cùng với sự xuất hiện của trí tuệ tập thể.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim