Конкуренція великих AI-моделей: інженерні виклики чи комерційні проблеми

2025-07-21 02:03:25

Конкурс великих моделей ШІ: інженерна проблема чи наукова задача?

Минулого місяця в світі ШІ спалахнула "бійня тварин".

Одна сторона – це Llama(, великий модель, випущена Meta, яка завдяки своїй відкритій природі користується популярністю серед розробників. Інша сторона – це великий модель під назвою Falcon), розроблений Науково-дослідницьким інститутом технологічних інновацій ОАЕ. Обидва моделі чергуються на вершині рейтингу відкритих LLM.

Цікаво, що уряд ОАЕ заявив, що участь у змаганні з ШІ має на меті "підірвати основних гравців". Сьогодні будь-яка країна та компанія, яка має певні фінансові можливості, працює над створенням своїх великих мовних моделей.

Ця ситуація "Битва моделей" виникла внаслідок публікації Google в 2017 році статті про алгоритм Transformer. Transformer вирішив багато проблем обробки природної мови, перетворивши великі моделі з теоретичних досліджень на чисто інженерні завдання. Скільки б не було обчислювальної потужності та даних, практично будь-яка команда може навчити велику модель.

Однак, розробка великих моделей не означає, що можна виграти в епоху ШІ. Хоча Llama від Meta не займає таку ж позицію, як Falcon, завдяки активній спільноті розробників вона все ще є орієнтиром для відкритих LLM. А що стосується продуктивності, більшість LLM все ще мають явну відстань до GPT-4.

Основна конкурентоспроможність великих моделей полягає в екосистемному розвитку або чистій здатності до міркування, а не лише в масштабах параметрів. Крім того, високі витрати на обчислювальні потужності також стали перешкодою для розвитку галузі. За оцінками, інвестиції глобальних технологічних компаній у інфраструктуру великих моделей значно перевищують їхній дохід.

На даний момент, окрім кількох винятків, більшість AI-компаній ще не знайшли прибуткову модель. Навіть такі програмні гіганти, як Microsoft та Adobe, стикаються з труднощами у встановленні цін на AI-продукти.

З посиленням конкуренції та збільшенням кількості відкритих моделей, прості постачальники великих моделей можуть зіткнутися з більшим тиском. У майбутньому цінність ШІ, можливо, більше проявиться у конкретних сценаріях застосування, а не в самій моделі.

GPT1.61%

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

24 лайків

Нагородити
24
7
Поділіться

Прокоментувати

0/400

GasGuzzler