Компанія з безпеки BlockSec повторно провела оцінку стандарту аудиту смарт-контрактів за допомогою AI під назвою EVMBench, розробленого OpenAI та Paradigm. Результати показали, що AI-боти значно менш ефективні при зіткненні з реальними сценаріями експлуатації.

Дослідницька група розширила тестове середовище, додавши більше конфігурацій моделей, а також включила нові випадки безпеки, що трапилися нещодавно — дані, які раніше не з’являлися у навчальних наборах AI-моделей.

Хоча AI ще не може замінити фахівців з безпеки, у звіті наголошується, що машинний інтелект може природно доповнювати процес перевірки коду людиною.

Початкові результати EVMBench можуть бути надто оптимістичними

Раніше EVMBench оцінював завдання безпеки смарт-контрактів, такі як виявлення, виправлення помилок і експлуатація вразливостей, з дуже вражаючими результатами. За даними звіту, AI може експлуатувати 72% і виявляти близько 45% вразливостей, на основі 120 вибраних зразків з аудитів Code4rena.

Однак BlockSec вважає, що початкові умови тестування могли спотворити результати. Співзасновник Yajin Zhou повідомив, що при повторному тестуванні з більшою кількістю конфігурацій і 22 реальними випадками атак рівень успішної експлуатації AI становив 0%.

Розширення конфігурацій і виключення “зараження даних”

Дослідження збільшило кількість конфігурацій моделей з 14 до 26, шляхом гнучкого поєднання ботів з різними “скелетами”, а не обмежуючись екосистемою одного постачальника. За словами дослідників, попередній підхід ускладнював розрізнення між продуктивністю через можливості моделі та перевагами архітектури.

Крім того, BlockSec поставив під сумнів явище “зараження даних”, коли EVMBench використовує вразливості, оприлюднені раніше — ймовірно, вже включені до навчальних даних AI. Щоб уникнути цього, команда протестувала 22 випадки безпеки, що трапилися після лютого 2026 року, які виходять за межі “вікна знань” моделей.

AI повністю провалився у реальній експлуатації

Найбільш вражаючий результат: у 110 пар тестів між агентами та випадками (5 агентів на 22 ситуації) жоден не завершився повною експлуатацією. Це свідчить, що навіть найсучасніші AI ще дуже далекі від здатності здійснювати реальні атаки.

Проте у виявленні вразливостей результати залишаються досить позитивними. Модель Claude Opus 4.6 найкраще показала себе, виявивши 13 з 20 реальних вразливостей.

Поширені, звичні вразливості AI виявляє легко, але більш складні випадки майже повністю пропускає.

Майбутнє — співпраця AI і людини

Дослідження робить висновок, що AI ще не може замінити людину у аудиті безпеки, і більш важливим є питання ефективної взаємодії двох сторін.

AI має переваги у масштабності та здатності швидко сканувати системи, тоді як людина переважає у глибокому аналізі, розумінні протоколів і логічних висновках. Ці фактори доповнюють один одного.

За даними BlockSec, правильний шлях — не замінити людину AI, а створити модель співпраці, яка забезпечить більш всебічний аудит.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

CryptoRank: лише 6 ICO завершено у 2026 році, фінансування сповільнюється

Звіти про індустрію

За даними CryptoRank, станом на сьогодні у 2026 році було завершено лише шість первинних розміщень токенів (ICO), і половина з них торгується нижче від ціни розміщення. Криптофінансування проходить структурний зсув: також уповільнилися венчурні раунди фінансування у квітні порівняно з початком року. Шість ICO

CryptoFrontier3год тому

CEX-ринкі обробляють $19,17 трлн у спотовій крипторизькі торгівлі у 2025 році, TradFi розширюється завдяки $37B M&A-активності

Звіти про індустрію Акції Форекс

Повідомлення Gate News: криптовалютні біржі обробили $19,17 трильйона спотових операцій із криптоактивами у 2025 році, тоді як ринки акцій досягли $155 трильйонів, а ринки валют здійснили $9,6 трильйона денних угод. Ринок побачив, як $37 мільярдів були спрямовані на TradFi M&A провідними гравцями, поруч із th

GateNews8год тому

Hyperscale Data Reports $5M у доходах від майнінгу в криптовалюті за I квартал 2026 року

Звіти про індустрію Акції

Hyperscale Data (NYSE American: GPUS) оприлюднила попередні показники виручки за перший квартал 2026 року: її бізнес з майнінгу криптовалют генерував приблизно 5 мільйонів доларів, що формувало загальну виручку компанії близько 44 мільйонів доларів, що на 76% більше в річному вимірі. Компанія планує продати свій диверсифікований

GateNews8год тому

SoFi повідомляє про дохід за 1 кв. на суму $1,1 млрд — зростання на 41% — і запускає стейблкоїн SoFiUSD

Події токенів Партнерства та екосистема Звіти про індустрію Акції

За даними Businesswire, SoFi Technologies повідомила про рекордну чисту виручку за 1 квартал у розмірі 1,1 мільярда доларів, що на 41% більше в річному вимірі, при чистому прибутку 167 мільйонів доларів, що стало її десятим поспіль кварталом прибутковості за GAAP. Фінтех-компанія офіційно запустила свій повністю резервований доларовий стейблкоїн SoFiUSD у США

GateNews8год тому

Ринок токенізованих RWA досяг 193,2 млрд доларів до кінця Q1 2026, зріс на 256% за 15 місяців

Звіти про індустрію

Згідно з CoinGecko, ринок токенізованих реальних активів (RWA) досяг 193,2 мільярда доларів до кінця 1 кварталу 2026 року, що на 256% більше за 54,2 мільярда доларів на початку 2025 року. Токенізовані казначейські зобов’язання лідирували в зростанні, формуючи 67,2% ринку приблизно на 130 мільярдів доларів, тоді як токенізовані комодіті піднялися до $

GateNews10год тому

Хакерські атаки в DeFi завдали збитків на $624,58 млн у квітні 2026 року — шості за величиною втрати в історії, при цьому зафіксовано найбільше інцидентів

Інциденти безпеки Ончейн-дані Звіти про індустрію

За даними DefiLlama, хакерські атаки на DeFi та інфраструктуру ончейн спричинили втрати на суму 624,58 мільйона доларів у квітні 2026 року, що стало шостим за величиною місячним обсягом збитків за весь час. 23 інциденти, зафіксовані того місяця, також є найбільшою кількістю атак за один місяць із моменту початку відстеження в

GateNews13год тому

Прокоментувати

0/400

Немає коментарів