Конкурс великих моделей ШІ: інженерна проблема чи наукова задача?
Минулого місяця в світі ШІ спалахнула "бійня тварин".
Одна сторона – це Llama(, великий модель, випущена Meta, яка завдяки своїй відкритій природі користується популярністю серед розробників. Інша сторона – це великий модель під назвою Falcon), розроблений Науково-дослідницьким інститутом технологічних інновацій ОАЕ. Обидва моделі чергуються на вершині рейтингу відкритих LLM.
Цікаво, що уряд ОАЕ заявив, що участь у змаганні з ШІ має на меті "підірвати основних гравців". Сьогодні будь-яка країна та компанія, яка має певні фінансові можливості, працює над створенням своїх великих мовних моделей.
Ця ситуація "Битва моделей" виникла внаслідок публікації Google в 2017 році статті про алгоритм Transformer. Transformer вирішив багато проблем обробки природної мови, перетворивши великі моделі з теоретичних досліджень на чисто інженерні завдання. Скільки б не було обчислювальної потужності та даних, практично будь-яка команда може навчити велику модель.
Однак, розробка великих моделей не означає, що можна виграти в епоху ШІ. Хоча Llama від Meta не займає таку ж позицію, як Falcon, завдяки активній спільноті розробників вона все ще є орієнтиром для відкритих LLM. А що стосується продуктивності, більшість LLM все ще мають явну відстань до GPT-4.
Основна конкурентоспроможність великих моделей полягає в екосистемному розвитку або чистій здатності до міркування, а не лише в масштабах параметрів. Крім того, високі витрати на обчислювальні потужності також стали перешкодою для розвитку галузі. За оцінками, інвестиції глобальних технологічних компаній у інфраструктуру великих моделей значно перевищують їхній дохід.
На даний момент, окрім кількох винятків, більшість AI-компаній ще не знайшли прибуткову модель. Навіть такі програмні гіганти, як Microsoft та Adobe, стикаються з труднощами у встановленні цін на AI-продукти.
З посиленням конкуренції та збільшенням кількості відкритих моделей, прості постачальники великих моделей можуть зіткнутися з більшим тиском. У майбутньому цінність ШІ, можливо, більше проявиться у конкретних сценаріях застосування, а не в самій моделі.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
19 лайків
Нагородити
19
6
Поділіться
Прокоментувати
0/400
StablecoinEnjoyer
· 07-22 01:32
Майстер все ще розуміє Llama yyds
Переглянути оригіналвідповісти на0
ForeverBuyingDips
· 07-21 02:33
купувати просадку вже й у AI колі, угу
Переглянути оригіналвідповісти на0
MidnightTrader
· 07-21 02:32
Грайся з великими моделями, хто вкладе гроші, той і виграє.
Переглянути оригіналвідповісти на0
bridge_anxiety
· 07-21 02:24
Лише мова про гроші.
Переглянути оригіналвідповісти на0
FlashLoanLarry
· 07-21 02:19
лол ще одна гонка з капіталізацією... метрики ефективності будуть ключовими тут, не буду приховувати
Конкуренція великих AI-моделей: інженерні виклики чи комерційні проблеми
Конкурс великих моделей ШІ: інженерна проблема чи наукова задача?
Минулого місяця в світі ШІ спалахнула "бійня тварин".
Одна сторона – це Llama(, великий модель, випущена Meta, яка завдяки своїй відкритій природі користується популярністю серед розробників. Інша сторона – це великий модель під назвою Falcon), розроблений Науково-дослідницьким інститутом технологічних інновацій ОАЕ. Обидва моделі чергуються на вершині рейтингу відкритих LLM.
Цікаво, що уряд ОАЕ заявив, що участь у змаганні з ШІ має на меті "підірвати основних гравців". Сьогодні будь-яка країна та компанія, яка має певні фінансові можливості, працює над створенням своїх великих мовних моделей.
Ця ситуація "Битва моделей" виникла внаслідок публікації Google в 2017 році статті про алгоритм Transformer. Transformer вирішив багато проблем обробки природної мови, перетворивши великі моделі з теоретичних досліджень на чисто інженерні завдання. Скільки б не було обчислювальної потужності та даних, практично будь-яка команда може навчити велику модель.
Однак, розробка великих моделей не означає, що можна виграти в епоху ШІ. Хоча Llama від Meta не займає таку ж позицію, як Falcon, завдяки активній спільноті розробників вона все ще є орієнтиром для відкритих LLM. А що стосується продуктивності, більшість LLM все ще мають явну відстань до GPT-4.
Основна конкурентоспроможність великих моделей полягає в екосистемному розвитку або чистій здатності до міркування, а не лише в масштабах параметрів. Крім того, високі витрати на обчислювальні потужності також стали перешкодою для розвитку галузі. За оцінками, інвестиції глобальних технологічних компаній у інфраструктуру великих моделей значно перевищують їхній дохід.
На даний момент, окрім кількох винятків, більшість AI-компаній ще не знайшли прибуткову модель. Навіть такі програмні гіганти, як Microsoft та Adobe, стикаються з труднощами у встановленні цін на AI-продукти.
З посиленням конкуренції та збільшенням кількості відкритих моделей, прості постачальники великих моделей можуть зіткнутися з більшим тиском. У майбутньому цінність ШІ, можливо, більше проявиться у конкретних сценаріях застосування, а не в самій моделі.