Непереборне злиття AI+Web3: нова структура від обчислювальної потужності до стимулювання даних

AI+Web3: Вежі та площі

ТЛ; ДОКТОР

  1. Проекти Web3 з концепцією штучного інтелекту стали привабливими для залучення капіталу на первинному та вторинному ринках.

  2. Можливості Web3 в індустрії ШІ проявляються в: використанні розподілених стимулів для координації потенційних постачань в довгому хвості — через дані, зберігання та обчислення; одночасно створюючи відкриті моделі та децентралізований ринок AI Agent.

  3. Штучний інтелект у сфері Web3 в основному використовується для фінансових послуг на блокчейні(, криптоплатежів, торгівлі, аналізу даних) та допомоги в розробці.

  4. Корисність AI+Web3 проявляється в їхній взаємодоповнюючості: Web3 має надію протистояти централізації AI, AI має надію допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

Останні два роки розвиток штучного інтелекту нагадує натиснуту клавішу прискорення, цей метеликовий ефект, викликаний Chatgpt, не лише відкрив новий світ генеративного штучного інтелекту, але й викликав хвилю в сфері Web3.

Під впливом концепції ШІ фінансування на ринку криптовалют, що сповільнюється, суттєво зросло. За статистикою, лише в першій половині 2024 року 64 проекти Web3+AI завершили фінансування, а операційна система на основі штучного інтелекту Zyber365 досягла максимальної суми фінансування в 100 мільйонів доларів на раунді А.

Вторинний ринок стає все більш процвітаючим, дані з криптоагрегатора Coingecko показують, що всього за рік загальна капіталізація AI сфери досягла 48,5 мільярдів доларів, а обсяг торгів за 24 години наближається до 8,6 мільярдів доларів; очевидні переваги, які принесли основні досягнення в AI технологіях, після випуску моделі OpenAI Sora для перетворення тексту в відео середня ціна в AI секторі зросла на 151%; ефект AI також поширюється на одну з категорій криптовалют, що притягують капітал, Meme: перша концепція AI Agent MemeCoin — GOAT швидко стала популярною і отримала оцінку в 1,4 мільярда доларів, успішно розпочавши бум AI Meme.

Дослідження та теми, пов'язані з AI+Web3, також набула популярності: від AI+Depin до AI Memecoin, а тепер до AI Agent і AI DAO, емоція FOMO вже не встигає за швидкістю зміни нових наративів.

AI+Web3, цей терміновий комбінацій, наповнений гарячими грошима, перспективами та майбутніми фантазіями, неминуче сприймається як зведена шлюбна угода, укладена капіталом, нам здається, що ми важко можемо розрізнити, під цією розкішною мантією, насправді чи є це майданчиком спекулянтів, чи це переддень вибуху світанку?

Щоб відповісти на це запитання, важливо розглянути, чи стане краще з іншою стороною? Чи можна отримати вигоду з моделі іншої сторони? У цій статті ми також намагаємося поглянути на цю структуру через призму попередніх досліджень: як Web3 може відігравати роль у всіх аспектах технологічного стеку AI, і що нового AI може принести Web3?

Частина 1 Які можливості у Web3 під стеком AI?

Перед тим, як розгорнути цю тему, нам потрібно зрозуміти технологічний стек великих моделей ШІ:

! AI+Web3: Вежі та Квадрати

Викладіть весь процес більш зрозумілою мовою: «Велика модель» подібна до людського мозку, на початковій стадії цей мозок належить лише що народженій дитині, яка потребує спостереження та споживання величезної кількості інформації з навколишнього світу, щоб зрозуміти цей світ, це стадія «збирання» даних; оскільки комп'ютери не мають людських зорових, слухових та інших сенсорних можливостей, на етапі навчання великі обсяги не маркованої інформації ззовні повинні бути перетворені через «попередню обробку» у формат інформації, зрозумілий і придатний для використання комп'ютерами.

Після введення даних ШІ за допомогою «навчання» створює модель, яка має здатність розуміти та прогнозувати, що можна розглядати як процес поступового розуміння та навчання дитини в зовнішньому світі. Параметри моделі схожі на мовні навички дитини, які постійно коригуються в процесі навчання. Коли зміст навчання починає розподілятися за предметами або під час спілкування з людьми отримується зворотний зв'язок і корекція, це переходить до етапу «донастройки» великої моделі.

Діти, коли ростуть і навчаються говорити, можуть розуміти зміст і висловлювати свої почуття та думки в нових розмовах. Ця стадія подібна до «інференції» у великих AI моделях, де модель може прогнозувати та аналізувати нові мовні та текстові вхідні дані. Діти виражають свої почуття, описують об'єкти та вирішують різні проблеми за допомогою мовних навичок, що також схоже на те, як великі AI моделі після завершення навчання застосовуються на етапі інференції для виконання різних специфічних завдань, таких як класифікація зображень, розпізнавання мови тощо.

AI Agent наближається до наступної форми великої моделі — здатної самостійно виконувати завдання та переслідувати складні цілі, що не лише має мисленнєві здібності, але й може запам'ятовувати, планувати та взаємодіяти зі світом за допомогою інструментів.

Наразі, у відповідь на болючі питання штучного інтелекту на різних стекових рівнях, Web3 наразі попередньо сформував багаторівневу, взаємозв'язану екосистему, що охоплює всі етапи процесу моделей штучного інтелекту.

Один. Базовий рівень: обчислювальна потужність та дані Airbnb

Потужність

На сьогодні одним із найбільших витрат у сфері штучного інтелекту є обчислювальна потужність та енергія, необхідні для навчання моделей та їхньої інференції.

Прикладом є те, що LLAMA3 від Meta потребує 16000 графічних процесорів H100, вироблених NVIDIA(, які є преміальними графічними процесорами, спеціально розробленими для штучного інтелекту та обчислювальних навантажень високої продуктивності, для завершення навчання потрібно 30 днів. Ціна за одиницю 80 ГБ версії коливається від 30 000 до 40 000 доларів, що потребує інвестицій у обчислювальне обладнання на суму від 400 до 700 мільйонів доларів)GPU+мережеві чіпи(, при цьому щомісячне навчання потребує 1,6 мільярда кіловат-годин, витрати на енергію щомісяця становлять майже 20 мільйонів доларів.

Розвантаження обчислювальної потужності AI є саме тією областю, де Web3 вперше перетинається з AI — DePin) децентралізовані фізичні інфраструктурні мережі( наразі сайт даних DePin Ninja вже представив понад 1400 проектів, серед яких проекти, що представляють обмін GPU обчислювальною потужністю, включають io.net, Aethir, Akash, Render Network тощо.

Основна логіка полягає в тому, що платформа дозволяє особам або суб'єктам, які мають бездіяльні ресурси GPU, без дозволу в децентралізований спосіб вносити свій обчислювальний потенціал, підвищуючи використання недостатньо експлуатованих ресурсів GPU через онлайн-ринок покупців і продавців, подібний до Uber або Airbnb, що дозволяє кінцевим користувачам отримувати більш дешеві та ефективні обчислювальні ресурси; одночасно механізм стейкінгу також забезпечує, що у разі порушення механізму контролю якості або переривання мережі, постачальники ресурсів отримують відповідні покарання.

Його особливість полягає в тому, що:

  • Збір вільних ресурсів GPU: постачальниками є переважно третій незалежний оператор середніх і малих дата-центрів, крипто-майнінгових ферм тощо, які мають надлишкові обчислювальні ресурси, обладнання для видобутку з механізмом консенсусу PoS, такі як майнери FileCoin та ETH. В даний час також є проекти, що прагнуть запускати пристрої з нижчим порогом входу, такі як exolab, що використовує MacBook, iPhone, iPad та інші локальні пристрої для створення обчислювальної мережі для інфраструктури великих моделей.

  • Перед обличчям довгого хвоста ринку обчислювальної потужності ШІ:

a. "З технічної точки зору" децентралізований ринок потужностей більш підходить для етапів виведення. Навчання більше залежить від обробної потужності даних, яку забезпечують надвеликий кластер GPU, тоді як для виведення вимоги до обчислювальної продуктивності GPU значно нижчі, як, наприклад, Aethir, що зосереджується на рендерингу з низькою затримкою та застосуваннях AI-виведення.

b. "З точки зору попиту" малі й середні споживачі обчислювальних потужностей не будуть окремо навчати свої великі моделі, а лише обиратимуть оптимізацію та доопрацювання навколо кількох провідних великих моделей, і ці сценарії природно підходять для розподілених невикористаних обчислювальних ресурсів.

  • Децентралізоване володіння: Технологічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко коригуючи їх відповідно до попиту, отримуючи при цьому прибуток.

)# Дані

Дані є основою штучного інтелекту. Якщо немає даних, обчислення подібні до плаваючої рослини, абсолютно безкорисні, а зв'язок між даними та моделлю нагадує приказку "Сміття на виході, сміття на вході". Кількість даних і якість введення визначають якість виходу остаточної моделі. Що стосується навчання сучасних AI моделей, дані визначають мовні можливості моделі, здатність до розуміння, навіть світогляд та гуманні прояви. Наразі труднощі з потребами AI у даних зосереджені на чотирьох основних аспектах:

  • Сатурація даних: навчання AI моделей залежить від великої кількості вхідних даних. Відкриті дані показують, що OpenAI навчала GPT-4 з параметрами на рівні трильйонів.

  • Якість даних: із поєднанням ШІ та різних галузей виникають нові вимоги до якості даних, зокрема до своєчасності даних, різноманітності даних, спеціалізації вертикальних даних та впливу нових джерел даних, таких як емоції в соціальних мережах.

  • Проблеми конфіденційності та відповідності: наразі різні країни та компанії поступово звертають увагу на важливість якісних наборів даних і вводять обмеження на збори наборів даних.

  • Високі витрати на обробку даних: велика кількість даних, складний процес обробки. Згідно з відкритими даними, понад 30% витрат на науково-дослідні роботи в AI-компаніях йдуть на збір і обробку базових даних.

Наразі рішення web3 втілюються в наступних чотирьох аспектах:

  1. Збір даних: можливість безкоштовно надавати зібрані реальні дані швидко вичерпується, витрати компаній з штучного інтелекту на дані зростають щороку. Але водночас ці витрати не повертаються до справжніх постачальників даних, платформи повністю насолоджуються цінністю, яку створюють дані.

Дати змогу справжнім користувачам також брати участь у створенні вартості, яку приносить дані, а також отримувати більш приватні та цінні дані від користувачів низькими витратами через розподілену мережу та механізми стимулювання — це бачення Web3.

  • Grass є децентралізованим рівнем даних та мережею, користувачі можуть запускати вузли Grass, вносячи вільну пропускну здатність та релейний трафік для захоплення в реальному часі даних з усього Інтернету та отримувати токенні винагороди;

  • Vana впроваджує унікальну концепцію пулу ліквідності даних ###DLP(, де користувачі можуть завантажувати свої приватні дані ), такі як записи покупок, звички перегляду, активність у соціальних мережах тощо ( до конкретного DLP і гнучко обирати, чи надавати ці дані в користування певним третім особам;

  • У PublicAI користувач може використовувати )Web3 як категорійний ярлик на X і @PublicAI для збору даних.

  1. Підготовка даних: під час обробки даних AI, оскільки зібрані дані зазвичай є шумними та містять помилки, їх потрібно очистити та перетворити в придатний формат перед навчанням моделі, що включає стандартизацію, фільтрацію та обробку відсутніх значень. Ця стадія є однією з небагатьох ручних етапів в індустрії AI, що призвела до виникнення галузі маркувальників даних. З підвищенням вимог моделі до якості даних, поріг входження для маркувальників даних також зріс, і це завдання природно підходить для децентралізованих механізмів винагороди Web3.
  • Наразі Grass та OpenLayer обидва розглядають можливість приєднання до цього ключового етапу маркування даних.

  • Synesis запропонував концепцію «Train2earn», підкреслюючи якість даних, користувачі можуть отримувати винагороди, надаючи розмічені дані, коментарі або інші форми внеску.

  • Проект маркування даних Sapien ігровим способом виконує завдання маркування та дозволяє користувачам ставити бали, щоб заробити більше балів.

  1. Конфіденційність даних та безпека: потрібно чітко розмежувати, що конфіденційність даних та безпека є двома різними концепціями. Конфіденційність даних стосується обробки чутливої інформації, тоді як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Відповідно, переваги технологій конфіденційності Web3 та потенційні сценарії їх застосування проявляються в двох аспектах: #AI或#1( навчання чутливих даних; )2( співпраця з даними: кілька власників даних можуть спільно брати участь у навчанні AI, не ділячись своїми оригінальними даними.

Актуальні технології конфіденційності в Web3 включають:

  • Достовірне виконуване середовище)TEE(, наприклад, Super Protocol;

  • Повна гомоморфна криптація ) FHE (, наприклад BasedAI, Fhenix.io або Inco Network;

  • Технологія нульових знань ) zk (, така як Reclaim Protocol, використовує технологію zkTLS для генерації доказів нульових знань для HTTPS-трафіку, що дозволяє користувачам безпечно імпортувати активності, репутацію та ідентифікаційні дані з зовнішніх веб-сайтів без розкриття чутливої інформації.

Однак на даний момент ця сфера все ще перебуває на ранній стадії, більшість проєктів все ще в процесі дослідження, одним із сучасних викликів є занадто високі витрати на обчислення, деякі приклади:

  • Фреймворк zkML EZKL потребує приблизно 80 хвилин для генерації доказу моделі 1M-nanoGPT.

  • Згідно з даними Modulus Labs, витрати zkML перевищують чисті обчислення більш ніж у 1000 разів.

  1. Зберігання даних: Після отримання даних потрібне місце для зберігання даних у ланцюгу, а також LLM, створеного за допомогою цих даних. Основною проблемою є доступність даних )DA(, до оновлення Danksharding в Ethereum пропускна здатність становила 0,08 МБ. У той же час, навчання AI-моделей та реальний аналіз зазвичай вимагають пропускної здатності даних від 50 до 100 ГБ на секунду. Ця різниця в масштабах ставить існуючі рішення на ланцюгу в безвихідь перед "ресурсомісткими AI-додатками."
  • 0g.AI є представником цієї категорії. Це проект, спрямований на
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Поділіться
Прокоментувати
0/400
wagmi_eventuallyvip
· 13год тому
Знову обман для дурнів.
Переглянути оригіналвідповісти на0
GasWastervip
· 13год тому
брат, l2s насправді можуть врятувати ШІ від того, щоб стати газовим кошмаром, чесно кажучи...
Переглянути оригіналвідповісти на0
consensus_whisperervip
· 13год тому
Це лише спекуляція, наступний.
Переглянути оригіналвідповісти на0
OPsychologyvip
· 13год тому
Це просто новий трюк для спекуляцій.
Переглянути оригіналвідповісти на0
BearMarketBarbervip
· 14год тому
Усі просто спекулюють концепціями, щоб заробити гроші~
Переглянути оригіналвідповісти на0
  • Закріпити