ШІ з українським ДНК. Навіщо Україна створює свою мовну модель і коли вона запрацює
- Амбітна мета: Україна прагне увійти до топ-3 країн світу з розвитку ШІ вже до 2030 року.
- АІ-суверенітет: українські фахівці створюють власну "фабрику ШІ" та національну мовну модель.
- Український контекст: власна АІ-інфраструктура дозволить захистити дані й оперувати правдивою інформацією.
- Доступність: спершу українська LLM стане основою для державних чатботів та AI-асистентів, але пізніше модель буде open-source (доступною для всіх).
- AI Factory (так звану фабрику штучного інтелекту, першу в країні державну інфраструктуру для АІ-рішень);
- національну LLM (велику мовну модель).
Україна може увійти в трійку країн світу з розвитку та впровадження ШІ до 2030 року (інфографіка РБК-Україна)
Що таке велика мовна модель або LLM
"Що таке українська велика мовна модель? Ми не створюємо новий ChatGPT або Gemini, чи будь-який інший продукт", - розповів представник Мінцифри.
Він пояснив, що "в межах кожного такого продукту є ядро, мозковий центр".
"Це ядро - велика мовна модель. Це - велика нейронна мережа, яка навчена на великих об'ємах інформації", - поділився Цьвок.
Навіщо Україні власна мовна модель
"Навіщо Україні національна велика мовна модель - LLM? Загально - іноземні моделі не мають глибокого розуміння українського контексту", - повідомив керівник напряму ШІ Мінцифри.
Він пояснив, що саме тому спеціалісти хочуть "створити модель, яка буде проукраїнською: розумітиме українську мову, культуру, історію, термінологію, національні особливості".
"По суті, це закладання цеглинки нашого ДНК у сферу штучного інтелекту. Наразі Мінцифра це робить у партнерстві з компанією Kyivstar", - поділився Цьвок.
Друга причина, за його словами, полягає в тому, що зараз люди живуть "в умовах інформаційної війни".
"Особливо важливо, щоб моделі давали відповіді на політичні й історичні теми без упереджень щодо України", - наголосив експерт.
Так, умовно кажучи, "не має виникати сумніву щодо Криму або щодо причин, які спровокували війну на Сході України". Або "що таке, наприклад, так звані ЛНР чи ДНР".
"Треба розуміти, що наш ворог також веде свою роботу. У нього свої підходи, як отруювати наявні на ринку великі мовні моделі. Тому нам потрібно мати насамперед першоджерело правди", - розповів Цьвок.
Насамкінець третя причина - "українська LLM буде в 2,5-3 рази дешевша за іноземні аналоги".
Україна створює власну велику мовну модель (інфографіка РБК-Україна)
"Маючи власну інфраструктуру та власну національну велику мовну модель, яка працює на державній інфраструктурі, ми повністю забезпечуємо AI-суверенітет. Це гарантує, що дані жодним чином не виходять за межі країни", - наголосив урядовець.
Отже, по суті, AI-суверенітет - здатність країни самостійно розробляти, запускати й контролювати системи штучного інтелекту (без критичної залежності від іноземних компаній, хмар чи моделей).
Коли може з'явитись перша версія української LLM
Цьвок розповів також, що нині українська мовна модель "якраз перебуває в активній фазі створення".
"Є технологічна частина, яку взяла на себе компанія партнер Kyivstar. Вони відповідають за процес розробки й тренування великої мовної моделі. Ми як держава відповідаємо за збір та агрегацію даних, на яких проводитимуть донавчання моделі", - поділився експерт.
Він зауважив, що зараз триває найважливіший етап - збір даних.
"До цього процесу залучені державні інституції, університети, наукові заклади, бізнеси, медіа тощо. Зусилля зосереджені на системі тестування (так звані бенчмарки). Вони вимірюють, наскільки добре модель знає українську історію, мову та чи дотримується вона етичних норм і права власності", - пояснив фахівець.
Крім того, було розроблено:
- критичні компоненти архітектури (наприклад, "токенайзер"), без яких неможливо побудувати велику мовну модель;
- пайплайн - послідовність певних кроків на рівні комп'ютерної інженерії (навчання крок за кроком на цих великих даних).