Từ dữ liệu lạnh đến dữ liệu nóng: Con đường tiến hóa của lưu trữ Phi tập trung

Phi tập trung lưu trữ của sự tiến hóa: từ FIL đến Shelby

Lưu trữ từng là một trong những lĩnh vực hot của ngành công nghiệp blockchain. Filecoin, với tư cách là dự án dẫn đầu trong đợt tăng giá trước đó, có lúc đạt giá trị thị trường hơn 10 tỷ USD. Arweave, nhờ vào ý tưởng lưu trữ vĩnh viễn, đã đạt giá trị thị trường cao nhất là 3,5 tỷ USD. Tuy nhiên, với tính thực tiễn của lưu trữ dữ liệu lạnh bị đặt câu hỏi, sự cần thiết của lưu trữ vĩnh viễn cũng bị thách thức, viễn cảnh của lưu trữ phi tập trung một thời trở nên mơ hồ.

Gần đây, sự xuất hiện của Walrus đã mang lại sức sống mới cho lĩnh vực lưu trữ vốn đã im ắng từ lâu. Dự án Shelby do Aptos hợp tác với Jump Crypto ra mắt, nhằm đưa lưu trữ phi tập trung vào lĩnh vực dữ liệu nóng lên một tầm cao mới. Vậy, liệu lưu trữ phi tập trung có thể phục hồi và hỗ trợ cho các trường hợp ứng dụng rộng rãi? Hay chỉ đơn giản là một đợt thổi phồng khái niệm khác? Bài viết này sẽ xuất phát từ lộ trình phát triển của bốn dự án Filecoin, Arweave, Walrus và Shelby, phân tích quá trình tiến hóa của lưu trữ phi tập trung, và khám phá khả năng phổ biến của lưu trữ phi tập trung.

Từ Filecoin, Arweave đến Walrus, Shelby: Đường đi đến sự phổ biến của lưu trữ phi tập trung còn xa bao nhiêu?

FIL: Lưu trữ bề mặt, thực chất là khai thác

Filecoin là một trong những dự án phi tập trung sớm nhất nổi lên, hướng phát triển của nó xoay quanh Phi tập trung, đây là đặc điểm chung của các dự án blockchain sớm. Filecoin kết hợp lưu trữ với Phi tập trung, cố gắng giải quyết vấn đề tin cậy của các nhà cung cấp dịch vụ lưu trữ dữ liệu tập trung. Tuy nhiên, một số khía cạnh bị hy sinh để đạt được Phi tập trung lại chính là những điểm đau mà các dự án như Arweave hoặc Walrus sau này cố gắng giải quyết.

IPFS: Giới hạn của kiến trúc Phi tập trung

IPFS( Hệ thống tệp liên sao) đã ra mắt từ năm 2015, nhằm mục đích cách mạng hóa giao thức HTTP truyền thống thông qua việc định vị nội dung. Tuy nhiên, nhược điểm lớn nhất của IPFS là tốc độ truy xuất rất chậm. Trong thời đại mà dịch vụ dữ liệu truyền thống có thể đạt được phản hồi trong mili giây, việc truy xuất một tệp từ IPFS vẫn cần đến hàng chục giây, điều này khiến nó khó có thể được áp dụng rộng rãi.

Giao thức P2P ở tầng IPFS chủ yếu phù hợp với "dữ liệu lạnh", tức là nội dung tĩnh không thường xuyên thay đổi. Tuy nhiên, khi xử lý dữ liệu nóng, như trang web động, trò chơi trực tuyến hoặc ứng dụng AI, giao thức P2P không có ưu thế rõ rệt so với CDN truyền thống.

Mặc dù IPFS bản thân không phải là blockchain, nhưng thiết kế DAG( có hướng và không có chu kỳ mà nó áp dụng phù hợp cao với nhiều chuỗi công khai và giao thức Web3, khiến nó tự nhiên phù hợp để trở thành khung xây dựng nền tảng cho blockchain. Do đó, ngay cả khi nó thiếu giá trị thực tiễn, nó đã đủ như một khung nền tảng để mang lại câu chuyện blockchain.

) Bản chất khai thác dưới lớp lưu trữ

Mục đích thiết kế của IPFS là cho phép người dùng không chỉ lưu trữ dữ liệu mà còn trở thành một phần của mạng lưu trữ. Tuy nhiên, trong trường hợp không có động lực kinh tế, rất khó để người dùng tự nguyện sử dụng hệ thống này, chưa kể đến việc trở thành các nút lưu trữ hoạt động. Điều này có nghĩa là hầu hết người dùng chỉ lưu trữ tệp trên IPFS mà không đóng góp không gian lưu trữ của mình hoặc lưu trữ tệp của người khác. Chính trong bối cảnh như vậy, FIL ra đời.

Trong mô hình kinh tế token của Filecoin, có ba vai trò chính: người dùng chịu trách nhiệm thanh toán phí để lưu trữ dữ liệu; thợ mỏ lưu trữ nhận được động lực token vì lưu trữ dữ liệu của người dùng; thợ mỏ truy xuất cung cấp dữ liệu khi người dùng cần và nhận được động lực.

Mô hình này tồn tại khoảng trống gian lận tiềm ẩn. Các thợ mỏ lưu trữ có thể lấp đầy dữ liệu rác để nhận phần thưởng sau khi cung cấp không gian lưu trữ. Do những dữ liệu rác này không được truy xuất, ngay cả khi bị mất, cũng sẽ không kích hoạt cơ chế trừng phạt. Điều này cho phép các thợ mỏ lưu trữ có thể xóa dữ liệu rác và lặp lại quy trình này. Bằng chứng sao chép đồng thuận của Filecoin chỉ có thể đảm bảo rằng dữ liệu của người dùng không bị xóa một cách trái phép, nhưng không thể ngăn chặn các thợ mỏ lấp đầy dữ liệu rác.

Việc vận hành của Filecoin phần lớn phụ thuộc vào sự đầu tư liên tục của các thợ mỏ vào nền kinh tế token, chứ không phải dựa vào nhu cầu thực sự của người dùng cuối đối với lưu trữ phân tán. Mặc dù dự án vẫn đang tiếp tục phát triển, nhưng ở giai đoạn hiện tại, việc xây dựng hệ sinh thái của Filecoin phù hợp hơn với định nghĩa của một dự án lưu trữ "dựa trên khai thác" thay vì "dựa trên ứng dụng".

Arweave: Lợi thế và giới hạn của chủ nghĩa dài hạn

So với việc Filecoin cố gắng xây dựng một "đám mây dữ liệu" phi tập trung có thể kích thích và chứng minh, Arweave lại đi theo một hướng cực đoan khác trong lưu trữ: cung cấp khả năng lưu trữ vĩnh viễn cho dữ liệu. Arweave không cố gắng xây dựng một nền tảng tính toán phân tán, mà toàn bộ hệ thống của nó xoay quanh một giả thuyết cốt lõi - dữ liệu quan trọng nên được lưu trữ một lần và tồn tại mãi mãi trên mạng. Sự cực đoan trong chủ nghĩa lâu dài này khiến cho Arweave khác biệt hẳn với Filecoin từ cơ chế, mô hình khuyến khích, đến yêu cầu phần cứng và góc độ kể chuyện.

Arweave lấy Bitcoin làm đối tượng học hỏi, cố gắng tối ưu hóa mạng lưu trữ vĩnh viễn của mình trong một chu kỳ dài tính bằng năm. Arweave không quan tâm đến tiếp thị, cũng không quan tâm đến đối thủ cạnh tranh và xu hướng phát triển của thị trường. Nó chỉ đơn giản là tiếp tục tiến lên trên con đường lặp lại kiến trúc mạng, ngay cả khi không ai chú ý, vì đó chính là bản chất của đội ngũ phát triển Arweave: chủ nghĩa dài hạn. Nhờ vào chủ nghĩa dài hạn, Arweave đã được hưởng ứng nồng nhiệt trong đợt tăng giá trước; cũng vì chủ nghĩa dài hạn, ngay cả khi rơi xuống đáy, Arweave vẫn có thể trụ vững qua vài vòng tăng giảm. Chỉ có điều liệu lưu trữ phi tập trung trong tương lai có chỗ đứng cho Arweave hay không? Giá trị tồn tại của lưu trữ vĩnh viễn chỉ có thể được chứng minh qua thời gian.

Mạng chính Arweave từ phiên bản 1.5 đến phiên bản 2.9 gần đây, mặc dù đã mất đi sự quan tâm của thị trường, nhưng vẫn đang nỗ lực để cho một phạm vi lớn hơn các thợ mỏ tham gia vào mạng với chi phí tối thiểu, và khuyến khích các thợ mỏ lưu trữ dữ liệu tối đa, giúp cho tính bền vững của toàn bộ mạng không ngừng được nâng cao. Arweave hiểu rõ rằng mình không phù hợp với sở thích của thị trường, đã chọn một lộ trình bảo thủ, không ôm lấy cộng đồng thợ mỏ, hệ sinh thái hoàn toàn đình trệ, nâng cấp mạng chính với chi phí tối thiểu, trong điều kiện không làm tổn hại đến an ninh mạng, liên tục giảm ngưỡng phần cứng.

Nhìn lại con đường nâng cấp từ 1.5-2.9

Phiên bản Arweave 1.5 đã tiết lộ lỗ hổng mà các thợ mỏ có thể dựa vào việc xếp chồng GPU thay vì lưu trữ thực để tối ưu hóa xác suất tạo khối. Để ngăn chặn xu hướng này, phiên bản 1.7 đã giới thiệu thuật toán RandomX, hạn chế việc sử dụng sức mạnh tính toán chuyên biệt, thay vào đó yêu cầu CPU đa dụng tham gia vào việc khai thác, từ đó làm suy yếu sự tập trung sức mạnh tính toán.

Trong phiên bản 2.0, Arweave áp dụng SPoA, chuyển đổi chứng minh dữ liệu thành cấu trúc đường dẫn Merkle Tree đơn giản, và giới thiệu giao dịch định dạng 2 để giảm tải đồng bộ. Kiến trúc này giảm áp lực băng thông mạng, làm cho khả năng phối hợp của các nút được tăng cường đáng kể. Tuy nhiên, một số thợ mỏ vẫn có thể tránh trách nhiệm sở hữu dữ liệu thực thông qua chiến lược hồ chứa lưu trữ tốc độ cao tập trung.

Để điều chỉnh sự thiên lệch này, 2.4 đã giới thiệu cơ chế SPoRA, đưa vào chỉ mục toàn cầu và truy cập ngẫu nhiên với hàm băm chậm, khiến các thợ mỏ phải thực sự nắm giữ các khối dữ liệu để tham gia vào việc tạo khối hiệu quả, từ đó làm giảm hiệu ứng tích lũy sức mạnh tính toán từ cơ chế. Kết quả là, các thợ mỏ bắt đầu chú trọng đến tốc độ truy cập lưu trữ, thúc đẩy việc ứng dụng SSD và thiết bị đọc ghi tốc độ cao. 2.6 đã giới thiệu chuỗi băm để kiểm soát nhịp độ tạo khối, cân bằng lợi ích biên của thiết bị hiệu suất cao, cung cấp không gian tham gia công bằng cho các thợ mỏ nhỏ và vừa.

Phiên bản tiếp theo tăng cường khả năng hợp tác mạng và sự đa dạng lưu trữ: 2.7 tăng cường khai thác hợp tác và cơ chế pool, nâng cao năng lực cạnh tranh của các thợ mỏ nhỏ; 2.8 ra mắt cơ chế đóng gói phức hợp, cho phép thiết bị dung lượng lớn tốc độ thấp tham gia linh hoạt; 2.9 giới thiệu quy trình đóng gói mới với định dạng replica_2_9, nâng cao đáng kể hiệu suất và giảm phụ thuộc vào tính toán, hoàn thành mô hình khai thác hướng dữ liệu.

Xét một cách tổng thể, lộ trình nâng cấp của Arweave rõ ràng thể hiện chiến lược dài hạn hướng tới lưu trữ: trong khi liên tục chống lại xu hướng tập trung sức mạnh tính toán, đồng thời hạ thấp rào cản tham gia, đảm bảo khả năng vận hành lâu dài của giao thức.

Walrus: Thử nghiệm mới về lưu trữ dữ liệu nóng

Thiết kế của Walrus hoàn toàn khác với Filecoin và Arweave. Điểm khởi đầu của Filecoin là xây dựng một hệ thống lưu trữ phi tập trung có thể xác minh, cái giá phải trả là lưu trữ dữ liệu lạnh; điểm khởi đầu của Arweave là xây dựng một thư viện Alexandria trên chuỗi có thể lưu trữ dữ liệu vĩnh viễn, cái giá phải trả là số lượng tình huống quá ít; điểm khởi đầu của Walrus là tối ưu hóa chi phí lưu trữ cho giao thức lưu trữ dữ liệu nóng.

RedStuff: Ứng dụng đổi mã sáng tạo

Trong thiết kế chi phí lưu trữ, Walrus cho rằng chi phí lưu trữ của Filecoin và Arweave là không hợp lý. Cả hai đều sử dụng kiến trúc sao chép hoàn toàn, lợi thế chính của chúng là mỗi nút đều giữ một bản sao hoàn chỉnh, có khả năng chống lỗi mạnh mẽ và sự độc lập giữa các nút. Kiến trúc này đảm bảo rằng ngay cả khi một số nút bị ngoại tuyến, mạng vẫn có khả năng truy cập dữ liệu. Tuy nhiên, điều này cũng có nghĩa là hệ thống cần có sự dư thừa bản sao để duy trì tính mạnh mẽ, từ đó làm tăng chi phí lưu trữ. Đặc biệt trong thiết kế của Arweave, cơ chế đồng thuận bản thân khuyến khích việc lưu trữ dư thừa của các nút để tăng cường tính bảo mật dữ liệu. So với đó, Filecoin có tính linh hoạt hơn trong việc kiểm soát chi phí, nhưng cái giá phải trả là một số lưu trữ chi phí thấp có thể đối mặt với rủi ro mất dữ liệu cao hơn. Walrus cố gắng tìm kiếm sự cân bằng giữa hai bên, cơ chế của nó kiểm soát chi phí sao chép đồng thời tăng cường tính khả dụng thông qua cách tái cấu trúc dư thừa, từ đó thiết lập một con đường thỏa hiệp mới giữa khả năng có được dữ liệu và hiệu quả chi phí.

Công nghệ RedStuff do Walrus tự phát triển là kỹ thuật chính để giảm thiểu độ dư thừa của nút, nó xuất phát từ mã Reed-Solomon###RS(. Mã RS là một thuật toán mã sửa lỗi rất truyền thống, mã sửa lỗi là một kỹ thuật cho phép nhân đôi tập dữ liệu bằng cách thêm các đoạn dư thừa, có thể được sử dụng để tái tạo dữ liệu gốc. Từ CD-ROM đến truyền thông vệ tinh và mã QR, nó được sử dụng thường xuyên trong cuộc sống hàng ngày.

Mã sửa lỗi cho phép người dùng nhận một khối, ví dụ 1MB, sau đó "mở rộng" nó lên 2MB, trong đó 1MB bổ sung được gọi là dữ liệu đặc biệt của mã sửa lỗi. Nếu bất kỳ byte nào trong khối bị mất, người dùng có thể dễ dàng phục hồi các byte đó thông qua mã. Ngay cả khi khối lên đến 1MB bị mất, toàn bộ khối vẫn có thể được phục hồi. Công nghệ tương tự cho phép máy tính đọc tất cả dữ liệu trên CD-ROM, ngay cả khi nó đã bị hư hỏng.

Hiện nay, mã RS là phương pháp được sử dụng phổ biến nhất. Cách thực hiện là bắt đầu từ k khối thông tin, xây dựng đa thức liên quan và đánh giá nó tại các tọa độ x khác nhau để thu được các khối mã. Sử dụng mã sửa lỗi RS, khả năng ngẫu nhiên lấy mẫu để mất một khối lượng lớn dữ liệu là rất nhỏ.

Đặc điểm nổi bật nhất của RedStuff là thông qua việc cải tiến thuật toán mã hóa xóa, Walrus có thể nhanh chóng và ổn định mã hóa các khối dữ liệu phi cấu trúc thành các mảnh nhỏ hơn, các mảnh này sẽ được lưu trữ phân tán trong một mạng lưới nút lưu trữ. Ngay cả khi mất đến hai phần ba các mảnh, vẫn có thể nhanh chóng tái cấu trúc lại khối dữ liệu gốc bằng cách sử dụng một phần các mảnh. Điều này trở nên khả thi trong khi giữ hệ số sao chép chỉ từ 4 đến 5 lần.

Do đó, việc định nghĩa Walrus như một giao thức phục hồi và dư thừa nhẹ được thiết kế lại xung quanh các kịch bản phi tập trung là hợp lý. So với mã sửa lỗi truyền thống ) như Reed-Solomon (, RedStuff không còn theo đuổi tính nhất quán toán học nghiêm ngặt, mà thay vào đó đã thực hiện những đánh đổi thực tế về phân phối dữ liệu, xác minh lưu trữ và chi phí tính toán. Mô hình này từ bỏ cơ chế giải mã ngay tức thì cần thiết cho việc lập lịch tập trung, thay vào đó, nó xác minh các nút có lưu trữ bản sao dữ liệu cụ thể hay không thông qua việc chứng thực trên chuỗi, từ đó thích ứng với cấu trúc mạng năng động và biên hóa hơn.

Cốt lõi thiết kế của RedStuff là chia dữ liệu thành hai loại: lát chính và lát phụ. Lát chính được sử dụng để phục hồi dữ liệu gốc, việc tạo ra và phân phối của nó chịu sự ràng buộc nghiêm ngặt, ngưỡng phục hồi là f+1, và cần 2f+1 chữ ký làm chứng minh khả dụng; lát phụ được tạo ra thông qua các phép toán đơn giản như tổng XOR, có vai trò cung cấp khả năng chịu lỗi linh hoạt, nâng cao độ tin cậy tổng thể của hệ thống. Cấu trúc này về bản chất giảm yêu cầu về tính nhất quán của dữ liệu - cho phép các nút khác nhau lưu trữ các phiên bản dữ liệu khác nhau trong thời gian ngắn, nhấn mạnh "tính nhất quán cuối cùng" như một con đường thực tiễn. Mặc dù có yêu cầu lỏng lẻo đối với các khối hồi tố trong các hệ thống như Arweave, đã đạt được một số hiệu quả trong việc giảm tải cho mạng, nhưng đồng thời cũng làm yếu đi sự đảm bảo tính khả dụng ngay lập tức và tính toàn vẹn của dữ liệu.

Không thể phủ nhận rằng, mặc dù RedStuff đã đạt được khả năng lưu trữ hiệu quả trong môi trường có công suất tính toán và băng thông thấp, nhưng về bản chất, nó vẫn thuộc về một "biến thể" của hệ thống mã sửa lỗi. Nó hy sinh một phần tính chắc chắn trong việc đọc dữ liệu, để đổi lấy kiểm soát chi phí và khả năng mở rộng trong môi trường phi tập trung. Tuy nhiên, ở cấp độ ứng dụng, liệu kiến trúc này có thể hỗ trợ cho các kịch bản dữ liệu tương tác quy mô lớn và tần suất cao hay không vẫn cần phải quan sát. Hơn nữa, RedStuff chưa thực sự đột phá vào tính toán mã hóa mà mã sửa lỗi đã tồn tại từ lâu.

FIL-0.38%
AR-0.86%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 4
  • Chia sẻ
Bình luận
0/400
DeFiDoctorvip
· 08-01 08:13
Quan sát lâm sàng: Dữ liệu nóng cũng chỉ là những vấn đề cũ với một lớp vỏ mới.
Xem bản gốcTrả lời0
AirdropCollectorvip
· 08-01 08:12
Cái fil cũ sẽ bị loại bỏ phải không?
Xem bản gốcTrả lời0
TokenAlchemistvip
· 08-01 08:10
phát hiện vector không hiệu quả... vẫn tăng giá trên fil nhưng câu chuyện lưu trữ lạnh đã chết fr
Xem bản gốcTrả lời0
MrRightClickvip
· 08-01 08:00
Chơi một vòng rồi quay lại fil đúng không?
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)