Розвиток технологій Web3 та ШІ: відкриття нових можливостей для обчислювальної потужності та цінності даних

AI+Web3: Вежі та площі

ТЛ; ДОКТОР

  1. Проекти Web3 з концепцією ШІ стають привабливими для залучення інвестицій на первинному та вторинному ринках.

  2. Можливості Web3 в індустрії штучного інтелекту проявляються в: використанні розподілених стимулів для координації потенційних постачальників у довгому хвості------через дані, зберігання та обчислення; водночас, створення відкритої моделі та децентралізованого ринку AI Agent.

  3. Основні сфери використання AI в індустрії Web3 - це фінанси на блокчейні (крипто-платежі, торгівля, аналіз даних) та допомога у розробці.

  4. Ефективність AI+Web3 проявляється в їхній взаємодоповнюючості: Web3 обіцяє протистояти централізації AI, а AI обіцяє допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

Останні два роки розвиток ШІ ніби натиснули на кнопку прискорення, ця метеликова крила, викликана Chatgpt, не тільки відкрила новий світ генеративного штучного інтелекту, але й викликала потужні хвилі в Web3 на іншому боці.

Під впливом концепції ШІ очевидно, що фінансування в криптовалютному ринку, що сповільнюється, стало активнішим. Згідно з даними ЗМІ, лише в першій половині 2024 року було завершено фінансування 64 проектів Web3+AI, а операційна система на базі штучного інтелекту Zyber365 на раунді A досягла максимального фінансування в 100 мільйонів доларів.

Ринок другорядних активів став ще більш процвітаючим, дані з одного з веб-сайтів свідчать, що за короткий час, трохи більше ніж за рік, загальна капіталізація сектора ШІ досягла 48,5 мільярда доларів, а обсяг торгів за 24 години наблизився до 8,6 мільярда доларів; позитивні новини, пов'язані з прогресом основних технологій ШІ, очевидні, після випуску моделі Sora для перетворення тексту в відео від однієї компанії середня ціна в секторі ШІ зросла на 151%; ефект ШІ також поширюється на одну з галузей криптовалют - меми: перша концепція AI Agent, мемекоїн ------ GOAT, швидко став популярним і досяг оцінки в 1,4 мільярда доларів, успішно розпочавши бум AI Meme.

Дослідження та теми про AI+Web3 також набирають популярності: від AI+Depin до AI Memecoin, а потім до сучасних AI Agent та AI DAO, емоції FOMO вже не встигають за швидкістю зміни нових наративів.

AI+Web3, ця термінологічна комбінація, наповнена гарячими грошима, можливостями та фантазіями про майбутнє, неминуче сприймається як шлюб, організований капіталом, нам, здається, важко розрізнити, чи це майданчик спекулянтів під цією розкішною накидкою, чи це ніч напередодні пробудження.

Щоб відповісти на це питання, ключове міркування для обох сторін полягає в тому, чи стане краще з присутністю один одного? Чи можуть вони отримати вигоду з моделей один одного? У цій статті ми також намагаємось поглянути на цю ситуацію з позицій попередників: як Web3 може відігравати роль на кожному етапі технологічного стеку AI, і що нове життя AI може принести Web3?

Частина 1 Які можливості має Web3 під стеком AI?

Перш ніж розпочати цю тему, нам потрібно зрозуміти технологічний стек великих моделей ШІ:

Використовуючи більш зрозумілу мову, щоб описати весь процес: «велика модель» схожа на людський мозок. На ранніх стадіях цей мозок належить новонародженій дитині, яка потребує спостереження та споживання величезної кількості інформації з навколишнього світу, щоб зрозуміти цей світ — це стадія «збирання» даних. Оскільки комп'ютер не має людських зорових, слухових та інших сенсорних можливостей, перед навчанням велика кількість неструктурованої інформації ззовні повинна бути перетворена за допомогою «попередньої обробки» у формат інформації, зрозумілий та придатний для комп'ютера.

Після введення даних ШІ через «навчання» створює модель, яка має здатність розуміти та прогнозувати, що можна вважати процесом, у якому немовля поступово розуміє та вивчає навколишній світ. Параметри моделі подібні до мовних здібностей немовляти, які постійно коригуються під час навчання. Коли вміст навчання починає диференціюватися, або під час спілкування з людьми отримується зворотний зв'язок і вносяться корективи, це переходить у стадію «долоні» великої моделі.

Діти, поступово дорослішаючи та навчаючись говорити, можуть розуміти сенс у нових розмовах та виражати свої почуття і думки. Цей етап подібний до «міркування» великих AI-моделей, які здатні передбачати та аналізувати нові мовні та текстові дані. Немовлята виражають свої почуття, описують об'єкти та вирішують різноманітні проблеми за допомогою мовних навичок, що також схоже на те, як великі AI-моделі застосовують свої навички під час етапу міркування після завершення навчання для виконання різних специфічних завдань, таких як класифікація зображень, розпізнавання мови тощо.

А AI Agent стає ближчим до наступної форми великої моделі ------ здатного самостійно виконувати завдання та переслідувати складні цілі, він не лише має можливість мислити, але й здатен запам'ятовувати, планувати та використовувати інструменти для взаємодії зі світом.

Наразі, щодо проблем, пов'язаних з AI на різних рівнях, Web3 наразі початково сформував багатошарову, взаємопов'язану екосистему, що охоплює всі етапи процесу моделей AI.

! AI+Web3: Вежі та Квадрати

Один. Базовий рівень: обчислювальна потужність та дані Airbnb

Потужність

Наразі однією з найвищих витрат у сфері ШІ є обчислювальна потужність та енергія, необхідні для навчання моделей та моделей висновків.

Один із прикладів - модель певної компанії потребує 16000 графічних процесорів (ГП) певної моделі, вироблених цією компанією (це топовий графічний процесор, спеціально розроблений для штучного інтелекту та обчислень високої продуктивності), щоб завершити навчання за 30 днів. Ціна на 80 ГБ версію становить від 30000 до 40000 доларів, що потребує інвестицій в обчислювальне обладнання (ГП + мережеві чіпи) від 400 до 700 мільйонів доларів, одночасно щомісяця навчання споживає 1,6 мільярда кіловат-годин, а витрати на енергію щомісяця складають близько 20 мільйонів доларів.

Розвантаження AI обчислювальної потужності також є однією з перших областей перетворення Web3 з AI ------ DePin (децентралізовані фізичні інфраструктурні мережі). Наразі один з веб-сайтів даних вже перерахував понад 1400 проектів, серед яких проекти, що представляють спільне використання GPU обчислювальної потужності, включають io.net, Aethir, Akash, Render Network тощо.

Основна логіка полягає в тому, що платформа дозволяє особам або організаціям з невикористаними ресурсами GPU вносити свій обчислювальний потенціал у децентралізований спосіб без необхідності отримувати дозвіл. Через онлайн-ринок, подібний до Uber або Airbnb, підвищується використання недостатньо використовуваних ресурсів GPU, що дозволяє кінцевим користувачам отримувати більш ефективні обчислювальні ресурси за нижчою ціною; водночас механізм стейкінгу також забезпечує, що у випадку порушення механізму контролю якості або переривання мережі постачальники ресурсів отримають відповідне покарання.

Її особливістю є:

  • Збір вільних ресурсів GPU: постачальники в основному складаються з надлишкової обчислювальної потужності, що належить незалежним невеликим та середнім дата-центрам, крипто-майнінговим фермам та іншим операторам, а також апаратного забезпечення для майнінгу з механізмом консенсусу PoS, як-от майнери FileCoin та ETH. Наразі також існують проекти, які прагнуть запустити обладнання з нижчим порогом входження, такі як exolab, що використовує локальні пристрої, такі як MacBook, iPhone, iPad, для створення обчислювальної мережі для інференції великих моделей.

  • Перед довгим хвостом ринку обчислювальних потужностей ШІ:

a. «З технічної точки зору» децентралізований ринок обчислювальних потужностей більше підходить для етапів висновків. Навчання більшою мірою залежить від обробної здатності даних, яку забезпечують надвеликий кластер GPU, тоді як висновки потребують відносно нижчих обчислювальних потужностей GPU, як-от Aethir, що зосереджується на рендерингу з низькою затримкою та AI-висновкових застосунках.

b. "З точки зору попиту" замалі споживачі обчислювальних ресурсів не будуть окремо тренувати свої великі моделі, а просто виберуть оптимізацію та доопрацювання навколо кількох провідних великих моделей, і ці сценарії природно підходять для розподілених незайнятих обчислювальних ресурсів.

  • Децентралізована власність: технічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко коригуючи їх відповідно до потреб та отримуючи прибуток.

Дані

Дані — це основа ШІ. Якщо немає даних, обчислення подібні до водоростей без коріння, абсолютно безкорисні, а зв'язок між даними та моделлю подібний до прислів'я "Сміття всередині, сміття назовні"; кількість даних і якість введення визначають остаточну якість виходу моделі. Для навчання сучасних ШІ-моделей дані визначають мовні можливості моделі, здатність до розуміння, навіть цінності та гуманістичні прояви. Наразі труднощі з потребами даних ШІ в основному зосереджені на чотирьох напрямках:

  • Голод даних: навчання AI моделей залежить від великої кількості даних. Відкриті дані показують, що одна компанія навчила модель з параметрами на трильйонному рівні.

  • Якість даних: з поєднанням ШІ та різних галузей, терміни даних, різноманітність даних, спеціалізація вертикальних даних, нові джерела даних, такі як сприйняття соціальних медіа, також ставлять нові вимоги до їхньої якості.

  • Проблеми конфіденційності та відповідності: наразі країни та підприємства поступово усвідомлюють важливість якісних наборів даних і вводять обмеження на збір даних.

  • Високі витрати на обробку даних: велика кількість даних, складний процес обробки. Відкриті дані показують, що понад 30% витрат на дослідження та розробки в AI компаніях йдуть на збір та обробку базових даних.

Наразі рішення web3 втілюються в чотирьох основних аспектах:

  1. Збір даних: можливість безкоштовно надавати зібрані дані з реального світу швидко вичерпується, витрати компаній з AI на дані зростають з року в рік. Але водночас ці витрати не повертаються до справжніх постачальників даних, платформи повністю користуються створенням вартості від даних, як, наприклад, одна платформа отримала 203 мільйони доларів доходу від угоди про ліцензування даних з компанією AI.

Дати можливість справжнім внескам користувачів також брати участь у створенні вартості, яку приносить дані, а також отримувати більш приватні та цінні дані користувачів за низькою вартістю через розподілену мережу та механізми стимулювання – це бачення Web3.

  • Grass є децентралізованим рівнем даних та мережею, користувачі можуть запустити вузли Grass, щоб вносити свій вільний трафік та рендерити потоки для збору в реальному часі даних з Інтернету, а також отримувати винагороду у вигляді токенів;

  • Vana впроваджує унікальну концепцію пулу ліквідності даних (DLP), де користувачі можуть завантажувати свої приватні дані (такі як історія покупок, звички перегляду, активність у соціальних мережах тощо) до певного DLP і гнучко вибирати, чи дозволяти цим даним використовуватися певними третіми сторонами;

  • У PublicAI користувачі можуть використовувати #AI 或#Web3 як категорію на певній платформі та @PublicAI для збору даних.

  1. Попередня обробка даних: під час обробки даних AI, оскільки зібрані дані зазвичай містять шум і помилки, їх необхідно очистити та перетворити в придатний формат перед навчанням моделі, що включає стандартизацію, фільтрацію та обробку відсутніх значень. Цей етап є одним з небагатьох ручних процесів в індустрії AI, що призвело до виникнення професії фахівця з розмітки даних. З підвищенням вимог моделі до якості даних, вимоги до фахівців з розмітки даних також зростають, і це завдання природно підходить для децентралізованих механізмів стимулювання Web3.
  • Наразі Grass та OpenLayer розглядають можливість приєднатися до цього ключового етапу позначення даних.

  • Synesis запропонував концепцію «Train2earn», підкреслюючи якість даних, користувачі можуть отримувати винагороди за надання маркованих даних, коментарів або інших форм внесків.

  • Проект маркування даних Sapien ігрофікує завдання маркування та дозволяє користувачам ставити бали, щоб заробити більше балів.

  1. Конфіденційність даних та безпека: слід чітко розуміти, що конфіденційність даних та безпека є двома різними концепціями. Конфіденційність даних стосується обробки чутливих даних, в той час як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Таким чином, переваги технологій конфіденційності Web3 і потенційні сфери застосування проявляються в двох аспектах: (1) навчання на чутливих даних; (2) співпраця з даними: кілька власників даних можуть спільно брати участь у навчанні ШІ, не ділячись своїми оригінальними даними.

Поточні технології конфіденційності, які є досить поширеними в Web3, включають:

  • Довірене виконуване середовище ( TEE ), наприклад, Super Protocol;

  • Повна гомоморфна криптографія (FHE), наприклад, BasedAI, Fhenix.io або Inco Network;

  • Технологія нульових знань (zk), така як Reclaim Protocol, використовує технологію zkTLS для генерації нульових доказів трафіку HTTPS, що дозволяє користувачам безпечно імпортувати активність, репутацію та дані про особу з зовнішніх веб-сайтів, не розкриваючи чутливу інформацію.

Проте, наразі ця сфера все ще перебуває на ранній стадії, більшість проектів все ще перебувають у стадії дослідження. Поточне питання полягає в надто високих витратах на обчислення, деякі приклади:

  • zkML фрейм EZKL потребує близько 80 хвилин
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 3
  • Поділіться
Прокоментувати
0/400
shadowy_supercodervip
· 17год тому
Технології повинні забезпечити рівні можливості.
Переглянути оригіналвідповісти на0
MEVHuntervip
· 17год тому
Сміливий прогноз буде дуже популярним
Переглянути оригіналвідповісти на0
LightningAllInHerovip
· 17год тому
Два мечі разом обов'язково стануть великим знаряддям
Переглянути оригіналвідповісти на0
  • Закріпити