Cập nhật DeepSeek V3: Khả năng tính toán và Thuật toán của kỷ nguyên mới
Gần đây, DeepSeek đã phát hành cập nhật phiên bản V3 mới nhất - DeepSeek-V3-0324 trên nền tảng Hugging Face. Phiên bản này có tham số mô hình đạt 6850 tỷ, với những cải tiến đáng kể về khả năng mã hóa, thiết kế giao diện người dùng và khả năng suy luận.
Tại hội nghị GTC 2025 vừa kết thúc, các lãnh đạo trong ngành đã đánh giá cao DeepSeek. Họ chỉ ra rằng quan điểm trước đây cho rằng mô hình hiệu quả của DeepSeek sẽ làm giảm nhu cầu về chip là sai lầm, và nhu cầu tính toán trong tương lai chỉ có thể tăng lên, không phải giảm đi.
DeepSeek như một sản phẩm đại diện cho sự đột phá của thuật toán, mối quan hệ giữa nó với nhà cung cấp chip đã gây ra những suy nghĩ về vai trò của khả năng tính toán và thuật toán trong sự phát triển của ngành.
Khả năng tính toán và sự tiến hóa đồng sinh của thuật toán
Trong lĩnh vực AI, khả năng tính toán được nâng cao đã cung cấp nền tảng để các thuật toán phức tạp hơn có thể chạy, giúp mô hình xử lý một lượng dữ liệu lớn hơn và học các mẫu phức tạp hơn; trong khi tối ưu hóa thuật toán có thể sử dụng khả năng tính toán một cách hiệu quả hơn, nâng cao hiệu suất sử dụng tài nguyên tính toán.
Khả năng tính toán và thuật toán có mối quan hệ cộng sinh đang tái định hình cấu trúc ngành AI:
Đường đi kỹ thuật phân hóa: Một số công ty theo đuổi việc xây dựng các cụm khả năng tính toán siêu lớn, trong khi những công ty khác lại tập trung vào tối ưu hóa hiệu suất thuật toán, hình thành các trường phái kỹ thuật khác nhau.
Tái cấu trúc chuỗi công nghiệp: Các ông lớn chip trở thành người dẫn đầu về khả năng tính toán AI thông qua hệ sinh thái, trong khi các nhà cung cấp dịch vụ đám mây giảm bớt rào cản triển khai thông qua dịch vụ khả năng tính toán linh hoạt.
Điều chỉnh phân bổ nguồn lực: Doanh nghiệp tìm kiếm sự cân bằng giữa đầu tư vào cơ sở hạ tầng phần cứng và phát triển thuật toán hiệu quả.
Sự trỗi dậy của cộng đồng mã nguồn mở: Mô hình mã nguồn mở cho phép chia sẻ các thành tựu đổi mới thuật toán và khả năng tính toán, tăng tốc độ lặp lại và lan tỏa công nghệ.
Đổi mới công nghệ của DeepSeek
Thành công của DeepSeek gắn liền với sự đổi mới công nghệ của nó. Dưới đây là giải thích đơn giản về những điểm đổi mới chính của nó:
Tối ưu hóa kiến trúc mô hình
DeepSeek áp dụng kiến trúc kết hợp giữa Transformer và MOE (Mixture of Experts), đồng thời giới thiệu cơ chế chú ý tiềm ẩn đa đầu (Multi-Head Latent Attention, MLA). Kiến trúc này giống như một đội ngũ siêu hạng, trong đó Transformer đảm nhiệm các nhiệm vụ thông thường, còn MOE giống như nhóm chuyên gia trong đội, mỗi chuyên gia có lĩnh vực chuyên môn riêng, khi gặp vấn đề cụ thể, sẽ có chuyên gia giỏi nhất xử lý, từ đó nâng cao đáng kể hiệu quả và độ chính xác của mô hình. Cơ chế MLA cho phép mô hình linh hoạt hơn trong việc chú ý đến các chi tiết quan trọng khác nhau khi xử lý thông tin, từ đó nâng cao hiệu suất của mô hình.
Phương pháp đào tạo cách mạng
DeepSeek đã đưa ra khung đào tạo hỗn hợp độ chính xác FP8. Khung này giống như một bộ phân phối tài nguyên thông minh, có khả năng chọn lựa độ chính xác tính toán phù hợp một cách linh hoạt dựa trên nhu cầu ở các giai đoạn khác nhau trong quá trình đào tạo. Sử dụng độ chính xác cao khi cần tính toán chính xác, để đảm bảo độ chính xác của mô hình; trong khi đó, giảm độ chính xác khi có thể chấp nhận độ chính xác thấp hơn, từ đó tiết kiệm tài nguyên tính toán, tăng tốc độ đào tạo và giảm chi phí bộ nhớ.
Nâng cao hiệu suất suy luận
Trong giai đoạn suy diễn, DeepSeek đã giới thiệu công nghệ Dự đoán đa Token (Multi-token Prediction, MTP). Phương pháp suy diễn truyền thống là từng bước một, mỗi bước chỉ dự đoán một Token. Trong khi đó, công nghệ MTP có thể dự đoán nhiều Token cùng một lúc, từ đó tăng tốc độ suy diễn một cách đáng kể và giảm chi phí suy diễn.
Đột phá thuật toán học tăng cường
Thuật toán học tăng cường GRPO (Tối ưu hóa thưởng - phạt tổng quát) mới của DeepSeek đã tối ưu hóa quá trình huấn luyện mô hình. Học tăng cường giống như trang bị cho mô hình một huấn luyện viên, dẫn dắt mô hình học hỏi những hành vi tốt hơn thông qua phần thưởng và hình phạt. Thuật toán mới của DeepSeek hiệu quả hơn, có khả năng giảm thiểu tính toán không cần thiết trong khi vẫn đảm bảo cải thiện hiệu suất của mô hình, đạt được sự cân bằng giữa hiệu suất và chi phí.
Những đổi mới này đã hình thành một hệ thống công nghệ hoàn chỉnh, từ đào tạo đến suy diễn, giảm thiểu nhu cầu về khả năng tính toán trên toàn chuỗi. Các card đồ họa tiêu dùng thông thường giờ đây cũng có thể chạy các mô hình AI mạnh mẽ, giảm đáng kể rào cản đối với các ứng dụng AI, cho phép nhiều nhà phát triển và doanh nghiệp tham gia vào đổi mới AI hơn.
Ảnh hưởng đến ngành công nghiệp chip
Nhiều người cho rằng DeepSeek đã bỏ qua một số lớp công nghệ, từ đó thoát khỏi sự phụ thuộc vào các chip cụ thể. Thực tế, DeepSeek thực hiện tối ưu hóa thuật toán trực tiếp thông qua lớp PTX (Parallel Thread Execution) ở cấp độ cơ sở. PTX là một ngôn ngữ biểu diễn trung gian nằm giữa mã cao cấp và các lệnh GPU thực tế, bằng cách thao tác trên lớp này, DeepSeek có thể đạt được việc tinh chỉnh hiệu suất một cách chi tiết hơn.
Tác động này đối với ngành công nghiệp chip là hai mặt: một mặt, DeepSeek thực sự gắn bó chặt chẽ hơn với phần cứng và hệ sinh thái liên quan, việc giảm bớt rào cản ứng dụng AI có thể mở rộng quy mô thị trường tổng thể; mặt khác, việc tối ưu hóa thuật toán của DeepSeek có thể thay đổi cấu trúc nhu cầu thị trường đối với chip cao cấp, một số mô hình AI vốn cần GPU cao cấp để hoạt động, giờ đây có thể chạy hiệu quả trên card đồ họa tầm trung thậm chí là card tiêu dùng.
Ý nghĩa đối với ngành công nghiệp AI Trung Quốc
Tối ưu hóa thuật toán của DeepSeek cung cấp con đường đột phá công nghệ cho ngành AI Trung Quốc. Trong bối cảnh hạn chế về chip cao cấp, tư duy "phần mềm bù phần cứng" đã giảm nhẹ sự phụ thuộc vào chip nhập khẩu hàng đầu.
Tại thượng nguồn, thuật toán hiệu quả đã giảm áp lực nhu cầu khả năng tính toán, giúp các nhà cung cấp dịch vụ khả năng tính toán có thể kéo dài chu kỳ sử dụng phần cứng thông qua tối ưu hóa phần mềm, tăng tỷ suất lợi nhuận đầu tư. Tại hạ nguồn, mô hình mã nguồn mở đã được tối ưu hóa giảm bớt rào cản phát triển ứng dụng AI. Nhiều doanh nghiệp vừa và nhỏ không cần nhiều tài nguyên khả năng tính toán, cũng có thể phát triển ứng dụng cạnh tranh dựa trên mô hình DeepSeek, sẽ thúc đẩy sự xuất hiện của nhiều giải pháp AI trong các lĩnh vực chuyên biệt hơn.
Ảnh hưởng sâu rộng của Web3+AI
Cơ sở hạ tầng AI phi tập trung
Tối ưu hóa thuật toán của DeepSeek đã cung cấp động lực mới cho cơ sở hạ tầng AI Web3, với kiến trúc sáng tạo, thuật toán hiệu quả và yêu cầu khả năng tính toán thấp hơn, khiến cho suy diễn AI phi tập trung trở nên khả thi. Kiến trúc MoE tự nhiên phù hợp cho việc triển khai phân tán, các nút khác nhau có thể nắm giữ các mạng chuyên gia khác nhau, không cần một nút duy nhất lưu trữ mô hình hoàn chỉnh, điều này giảm đáng kể yêu cầu lưu trữ và tính toán của một nút đơn, từ đó nâng cao tính linh hoạt và hiệu quả của mô hình.
Khung đào tạo FP8 đã giảm bớt nhu cầu về tài nguyên tính toán cao cấp, cho phép nhiều tài nguyên tính toán hơn có thể tham gia vào mạng lưới nút. Điều này không chỉ giảm bớt rào cản tham gia vào tính toán AI phi tập trung mà còn nâng cao khả năng và hiệu quả tính toán của toàn bộ mạng.
Hệ thống đa tác nhân
Tối ưu hóa chiến lược giao dịch thông minh: Thông qua việc phân tích dữ liệu thị trường theo thời gian thực của agent, dự đoán biến động giá ngắn hạn của agent, thực hiện giao dịch trên chuỗi của agent, giám sát kết quả giao dịch của agent, giúp người dùng đạt được lợi nhuận cao hơn.
Thực thi tự động của hợp đồng thông minh: tác nhân giám sát hợp đồng thông minh, tác nhân thực thi hợp đồng thông minh, tác nhân giám sát kết quả thực thi, v.v. hoạt động cộng tác để thực hiện tự động hóa logic kinh doanh phức tạp hơn.
Quản lý danh mục đầu tư cá nhân hóa: AI giúp người dùng tìm kiếm cơ hội đặt cược hoặc cung cấp tính thanh khoản tốt nhất theo sở thích rủi ro, mục tiêu đầu tư và tình hình tài chính của người dùng trong thời gian thực.
DeepSeek chính là trong điều kiện hạn chế khả năng tính toán, thông qua đổi mới thuật toán tìm kiếm đột phá, mở ra con đường phát triển khác biệt cho ngành AI Trung Quốc. Giảm bớt rào cản ứng dụng, thúc đẩy sự kết hợp giữa Web3 và AI, giảm bớt sự phụ thuộc vào chip cao cấp, trao quyền cho đổi mới tài chính, những tác động này đang định hình lại cấu trúc kinh tế kỹ thuật số. Sự phát triển của AI trong tương lai không còn chỉ là cuộc đua về khả năng tính toán, mà là cuộc đua tối ưu hóa phối hợp giữa khả năng tính toán và thuật toán. Trên đường đua mới này, các nhà đổi mới như DeepSeek đang sử dụng trí tuệ Trung Quốc để định nghĩa lại các quy tắc trò chơi.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
11 thích
Phần thưởng
11
6
Chia sẻ
Bình luận
0/400
DeFi_Dad_Jokes
· 07-28 17:01
Bạn có muốn thử chạy ETH không?
Xem bản gốcTrả lời0
DAOdreamer
· 07-27 02:24
Tốc độ To da moon! Cuối cùng cũng làm được qua gpt rồi.
Xem bản gốcTrả lời0
TheMemefather
· 07-26 22:17
Một cái nữa mang danh nghĩa Thả chi phí
Xem bản gốcTrả lời0
0xOverleveraged
· 07-26 22:07
Tuyệt vời, AI nội địa đang nổi lên.
Xem bản gốcTrả lời0
RetailTherapist
· 07-26 22:04
6850 tỷ thật đáng sợ, đúng là Khả năng tính toán quái vật
Xem bản gốcTrả lời0
GateUser-75ee51e7
· 07-26 22:03
Yêu cầu về chip có thể giảm không? Ai hiểu thì nói cho tôi biết.
Cập nhật DeepSeek V3: Khả năng tính toán và thuật toán cùng nhảy múa, tái cấu trúc ngành công nghiệp AI
Cập nhật DeepSeek V3: Khả năng tính toán và Thuật toán của kỷ nguyên mới
Gần đây, DeepSeek đã phát hành cập nhật phiên bản V3 mới nhất - DeepSeek-V3-0324 trên nền tảng Hugging Face. Phiên bản này có tham số mô hình đạt 6850 tỷ, với những cải tiến đáng kể về khả năng mã hóa, thiết kế giao diện người dùng và khả năng suy luận.
Tại hội nghị GTC 2025 vừa kết thúc, các lãnh đạo trong ngành đã đánh giá cao DeepSeek. Họ chỉ ra rằng quan điểm trước đây cho rằng mô hình hiệu quả của DeepSeek sẽ làm giảm nhu cầu về chip là sai lầm, và nhu cầu tính toán trong tương lai chỉ có thể tăng lên, không phải giảm đi.
DeepSeek như một sản phẩm đại diện cho sự đột phá của thuật toán, mối quan hệ giữa nó với nhà cung cấp chip đã gây ra những suy nghĩ về vai trò của khả năng tính toán và thuật toán trong sự phát triển của ngành.
Khả năng tính toán và sự tiến hóa đồng sinh của thuật toán
Trong lĩnh vực AI, khả năng tính toán được nâng cao đã cung cấp nền tảng để các thuật toán phức tạp hơn có thể chạy, giúp mô hình xử lý một lượng dữ liệu lớn hơn và học các mẫu phức tạp hơn; trong khi tối ưu hóa thuật toán có thể sử dụng khả năng tính toán một cách hiệu quả hơn, nâng cao hiệu suất sử dụng tài nguyên tính toán.
Khả năng tính toán và thuật toán có mối quan hệ cộng sinh đang tái định hình cấu trúc ngành AI:
Đổi mới công nghệ của DeepSeek
Thành công của DeepSeek gắn liền với sự đổi mới công nghệ của nó. Dưới đây là giải thích đơn giản về những điểm đổi mới chính của nó:
Tối ưu hóa kiến trúc mô hình
DeepSeek áp dụng kiến trúc kết hợp giữa Transformer và MOE (Mixture of Experts), đồng thời giới thiệu cơ chế chú ý tiềm ẩn đa đầu (Multi-Head Latent Attention, MLA). Kiến trúc này giống như một đội ngũ siêu hạng, trong đó Transformer đảm nhiệm các nhiệm vụ thông thường, còn MOE giống như nhóm chuyên gia trong đội, mỗi chuyên gia có lĩnh vực chuyên môn riêng, khi gặp vấn đề cụ thể, sẽ có chuyên gia giỏi nhất xử lý, từ đó nâng cao đáng kể hiệu quả và độ chính xác của mô hình. Cơ chế MLA cho phép mô hình linh hoạt hơn trong việc chú ý đến các chi tiết quan trọng khác nhau khi xử lý thông tin, từ đó nâng cao hiệu suất của mô hình.
Phương pháp đào tạo cách mạng
DeepSeek đã đưa ra khung đào tạo hỗn hợp độ chính xác FP8. Khung này giống như một bộ phân phối tài nguyên thông minh, có khả năng chọn lựa độ chính xác tính toán phù hợp một cách linh hoạt dựa trên nhu cầu ở các giai đoạn khác nhau trong quá trình đào tạo. Sử dụng độ chính xác cao khi cần tính toán chính xác, để đảm bảo độ chính xác của mô hình; trong khi đó, giảm độ chính xác khi có thể chấp nhận độ chính xác thấp hơn, từ đó tiết kiệm tài nguyên tính toán, tăng tốc độ đào tạo và giảm chi phí bộ nhớ.
Nâng cao hiệu suất suy luận
Trong giai đoạn suy diễn, DeepSeek đã giới thiệu công nghệ Dự đoán đa Token (Multi-token Prediction, MTP). Phương pháp suy diễn truyền thống là từng bước một, mỗi bước chỉ dự đoán một Token. Trong khi đó, công nghệ MTP có thể dự đoán nhiều Token cùng một lúc, từ đó tăng tốc độ suy diễn một cách đáng kể và giảm chi phí suy diễn.
Đột phá thuật toán học tăng cường
Thuật toán học tăng cường GRPO (Tối ưu hóa thưởng - phạt tổng quát) mới của DeepSeek đã tối ưu hóa quá trình huấn luyện mô hình. Học tăng cường giống như trang bị cho mô hình một huấn luyện viên, dẫn dắt mô hình học hỏi những hành vi tốt hơn thông qua phần thưởng và hình phạt. Thuật toán mới của DeepSeek hiệu quả hơn, có khả năng giảm thiểu tính toán không cần thiết trong khi vẫn đảm bảo cải thiện hiệu suất của mô hình, đạt được sự cân bằng giữa hiệu suất và chi phí.
Những đổi mới này đã hình thành một hệ thống công nghệ hoàn chỉnh, từ đào tạo đến suy diễn, giảm thiểu nhu cầu về khả năng tính toán trên toàn chuỗi. Các card đồ họa tiêu dùng thông thường giờ đây cũng có thể chạy các mô hình AI mạnh mẽ, giảm đáng kể rào cản đối với các ứng dụng AI, cho phép nhiều nhà phát triển và doanh nghiệp tham gia vào đổi mới AI hơn.
Ảnh hưởng đến ngành công nghiệp chip
Nhiều người cho rằng DeepSeek đã bỏ qua một số lớp công nghệ, từ đó thoát khỏi sự phụ thuộc vào các chip cụ thể. Thực tế, DeepSeek thực hiện tối ưu hóa thuật toán trực tiếp thông qua lớp PTX (Parallel Thread Execution) ở cấp độ cơ sở. PTX là một ngôn ngữ biểu diễn trung gian nằm giữa mã cao cấp và các lệnh GPU thực tế, bằng cách thao tác trên lớp này, DeepSeek có thể đạt được việc tinh chỉnh hiệu suất một cách chi tiết hơn.
Tác động này đối với ngành công nghiệp chip là hai mặt: một mặt, DeepSeek thực sự gắn bó chặt chẽ hơn với phần cứng và hệ sinh thái liên quan, việc giảm bớt rào cản ứng dụng AI có thể mở rộng quy mô thị trường tổng thể; mặt khác, việc tối ưu hóa thuật toán của DeepSeek có thể thay đổi cấu trúc nhu cầu thị trường đối với chip cao cấp, một số mô hình AI vốn cần GPU cao cấp để hoạt động, giờ đây có thể chạy hiệu quả trên card đồ họa tầm trung thậm chí là card tiêu dùng.
Ý nghĩa đối với ngành công nghiệp AI Trung Quốc
Tối ưu hóa thuật toán của DeepSeek cung cấp con đường đột phá công nghệ cho ngành AI Trung Quốc. Trong bối cảnh hạn chế về chip cao cấp, tư duy "phần mềm bù phần cứng" đã giảm nhẹ sự phụ thuộc vào chip nhập khẩu hàng đầu.
Tại thượng nguồn, thuật toán hiệu quả đã giảm áp lực nhu cầu khả năng tính toán, giúp các nhà cung cấp dịch vụ khả năng tính toán có thể kéo dài chu kỳ sử dụng phần cứng thông qua tối ưu hóa phần mềm, tăng tỷ suất lợi nhuận đầu tư. Tại hạ nguồn, mô hình mã nguồn mở đã được tối ưu hóa giảm bớt rào cản phát triển ứng dụng AI. Nhiều doanh nghiệp vừa và nhỏ không cần nhiều tài nguyên khả năng tính toán, cũng có thể phát triển ứng dụng cạnh tranh dựa trên mô hình DeepSeek, sẽ thúc đẩy sự xuất hiện của nhiều giải pháp AI trong các lĩnh vực chuyên biệt hơn.
Ảnh hưởng sâu rộng của Web3+AI
Cơ sở hạ tầng AI phi tập trung
Tối ưu hóa thuật toán của DeepSeek đã cung cấp động lực mới cho cơ sở hạ tầng AI Web3, với kiến trúc sáng tạo, thuật toán hiệu quả và yêu cầu khả năng tính toán thấp hơn, khiến cho suy diễn AI phi tập trung trở nên khả thi. Kiến trúc MoE tự nhiên phù hợp cho việc triển khai phân tán, các nút khác nhau có thể nắm giữ các mạng chuyên gia khác nhau, không cần một nút duy nhất lưu trữ mô hình hoàn chỉnh, điều này giảm đáng kể yêu cầu lưu trữ và tính toán của một nút đơn, từ đó nâng cao tính linh hoạt và hiệu quả của mô hình.
Khung đào tạo FP8 đã giảm bớt nhu cầu về tài nguyên tính toán cao cấp, cho phép nhiều tài nguyên tính toán hơn có thể tham gia vào mạng lưới nút. Điều này không chỉ giảm bớt rào cản tham gia vào tính toán AI phi tập trung mà còn nâng cao khả năng và hiệu quả tính toán của toàn bộ mạng.
Hệ thống đa tác nhân
Tối ưu hóa chiến lược giao dịch thông minh: Thông qua việc phân tích dữ liệu thị trường theo thời gian thực của agent, dự đoán biến động giá ngắn hạn của agent, thực hiện giao dịch trên chuỗi của agent, giám sát kết quả giao dịch của agent, giúp người dùng đạt được lợi nhuận cao hơn.
Thực thi tự động của hợp đồng thông minh: tác nhân giám sát hợp đồng thông minh, tác nhân thực thi hợp đồng thông minh, tác nhân giám sát kết quả thực thi, v.v. hoạt động cộng tác để thực hiện tự động hóa logic kinh doanh phức tạp hơn.
Quản lý danh mục đầu tư cá nhân hóa: AI giúp người dùng tìm kiếm cơ hội đặt cược hoặc cung cấp tính thanh khoản tốt nhất theo sở thích rủi ro, mục tiêu đầu tư và tình hình tài chính của người dùng trong thời gian thực.
DeepSeek chính là trong điều kiện hạn chế khả năng tính toán, thông qua đổi mới thuật toán tìm kiếm đột phá, mở ra con đường phát triển khác biệt cho ngành AI Trung Quốc. Giảm bớt rào cản ứng dụng, thúc đẩy sự kết hợp giữa Web3 và AI, giảm bớt sự phụ thuộc vào chip cao cấp, trao quyền cho đổi mới tài chính, những tác động này đang định hình lại cấu trúc kinh tế kỹ thuật số. Sự phát triển của AI trong tương lai không còn chỉ là cuộc đua về khả năng tính toán, mà là cuộc đua tối ưu hóa phối hợp giữa khả năng tính toán và thuật toán. Trên đường đua mới này, các nhà đổi mới như DeepSeek đang sử dụng trí tuệ Trung Quốc để định nghĩa lại các quy tắc trò chơi.