Штучний інтелект: від міфів до реальності. Де закінчується правда і починаються ілюзії?

Опубліковано: 26 вересня 09:44
Я їжджу на Ford Focus III Hatchback
Київ, Україна

Привіт усім, хто любить довгі цікаві тексти 😁. Сьогодні говоримо з вами про ШІ. Що це і для кого? Як воно працює?  Чи може замінити діагноста на СТО, написати ідеальну статтю для блогу чи стати вам справжнім другом?  Адже, погодьтесь, про нейромережі зараз не говорить хіба що лінивий і тема ця поневолі обростає міфами, домислами та відвертими нісенітницями.


Давайте розберемося без зайвого ажіотажу: що лежить в основі ШІ, чому не варто вважати мовні моделі всезнаючими «богами» і як використовувати сучасні корпоративні ШІ, щоб вони приносили користь, а не фінансові витрати через помилкову діагностику. Заразом трохи посміхнемося з людей, які зробили «релігію» з ChatGPT, та навіть зможемо зрозуміти, чи здатен ШІ нашкодити людству.


Я - один з тисяч бета тестерів однієї з комерційних мовних моделей і не є експертом в темі штучного інтелекту, втім маю достатньо досвіду використання цих інструментів у повсякденні і мені є про що вам розповісти. Тож, до справи.



ШІ - найвеличніший «ілюзіоніст» в історії людства


Почнемо з теорії. GPT - це архітектура («Generative Pre-trained Transformer»), на основі якої створюються великі мовні моделі (LLM). Це не якась футуристична істота з майбутнього, яка має «мозок» як у людини. Це навіть не Skynet з фільмів про Термінатора 😎. Технічно - це ілюзія реального інтелекту: набір коду, алгоритмів і програм, які дозволяють комп'ютерам виконувати завдання, що раніше були можливі тільки для оператора (людини).


Важливо розуміти, що ШІ - це не тільки ChatGPT або інші чат-боти на схожих архітектурах, а цілий спектр систем для обробки даних, розпізнавання зображень, управління пристроями тощо. Розпізнавання голосу в вашому смартфоні чи автоматичний перекладач - це типові приклади мовних моделей (LLM). А от автопілот Tesla, наприклад, належить вже до іншого класу - вузькоспеціалізованих систем комп’ютерного зору та керування. Усі вони, в тій чи іншій мірі ШІ, але працюють за різними принципами.


В основі LLM лежить машинне навчання. Модель проходить початкове, «загальне» навчання на величезному корпусі даних, що дає їй узагальнене (патерне) розуміння структури даних з якими вона буде працювати.  «Базова» модель може бути «донавчена» (fine-tuned) для специфічних завдань. Уявіть, що ви вчите дитину розпізнавати автомобілі – показуєте тисячі фото Ford, BMW, Toyota, і вона починає розуміти, що таке «машина» і чим один бренд відрізняється від іншого. Так само працює ШІ, тільки дані – це мільярди рядків тексту, зображень чи цифр.


Ми не будемо в цьому дописі розглядати вузькоспеціалізовані моделі ШІ, зосередившись замість цього на LLMs.


Варто розуміти, що незважаючи на величезну обчислювальну потужність, сьогодні не існує такої моделі, яка б вміла все й одразу, а будь-який ШІ має фізичні обмеження. Перша фундаментальна особливість - нейромережа не вміє вільно імпровізувати в людському розумінні цього слова. Модель обмежена тими параметрами на яких була тренована. Це не дає алгоритму шукати рішення запросів «нестандартно», знаходячи відповідь поза межами відомих патернів. 


Наведу реальний випадок з тестів:


Двом різним великим мовним моделям було задано однакове питання: «В мене є металева кружка верх якої заварили металевим диском, а дно - відрізали. Як тепер можна її використовувати за призначенням?». Для людини відповідь на це питання очевидна, а от піддослідні ШІ (якими ви користуєтесь щодня) не змогли тоді знайти подальшого «прямого» застосування такій кружці та запропонували зробити з неї арт-об'єкт 😂 (пізніше цей «баг» було закрито).


Друга не менш важлива деталь - інформація, на якій навчають ШІ є не завжди актуальна. Особливо в офлайн моделях з GitHub розроблених невеликими студіями, які не мають підтримки збоку спільноти ентузіастів або великих компаній. Такі ізольовані моделі хоч і не є широко популярними, але їх також використовують. Візьмемо як приклад  прошивки в наших автомобілях. Версії цих файлів на серверах постійно оновлюються, а в наших старих – знаходять нові «баги». Якщо такий ШІ навчили на даних 2023 року, то він нічого не знатиме про оновлення випущені після цього й надасть стару інформацію підігнавши її під контекст вашого запиту. Те само буде і з будь-якою іншою темою, будь то музика чи література. 


Окремої уваги заслуговують вже згадані раніше великі комерційні моделі, такі як Grok від xAI,  ChatGPT від OpenAI або Google Gemini. Вони значно складніші й потужніші, використовують принцип RAG (Retrieval-Augmented Generation) та мають доступ до інформації в реальному часі через інтегровані інструменти на базі трансформерів. Такі рішення надають актуальніші відповіді й можуть вирішити ширше коло питань з меншою кількістю помилок. Також вони більш цензуровані та мають внутрішні механізми безпеки, що зменшує ризик виникнення «галюцинацій» (технічний термін, який означає, що ШІ має схильність «вигадувати» дані, якщо не може знайти реальні) та запобігає появі  небезпечних порад у критичних сферах. Онлайн моделі гнучкіші. Вони точніше відповідають на запити користувачів, працюють із зображеннями та мають доступ до інших інструментів, але в основі їхньої роботи й досі лежать статистичні ймовірності, що автоматично виключає 100% точність.


Чому мовну модель не варто вважати «богом» інформації: фізичні обмеження та реальність


На практиці, багато людей переоцінює можливості генеративного ШІ. Є розповсюджена думка, що ШІ знає все: «Лише запитай, і отримаєш бездоганну відповідь!». Люди тягнуть інформацію від ШІ щиро вважаючи її абсолютною істиною. Таке ставлення до цієї технології є в корені хибним і якщо ви теж такої думки, то вам варто її почати змінювати прямо зараз. 

По факту, мовна модель - це як великий «калькулятор» для тексту або «жонглер» фразами. LLM комбінує вже відомі патерни генеруючи для вас відповідь та виконує (або передає іншим інструментам) запити користувачів (наприклад, при генерації зображень). ШІ аналізує контекст розмови у межах свого «вікна уваги» - обмеженого обсягу інформації, який модель може одночасно утримувати в пам’яті. Як ліхтарик у темній кімнаті, він «бачить» лише те, на що спрямований, і чим довшим та тематично розфокусованим є запит, тим менш точні відповіді ви отримаєте.


Загально, спростивши суть та відкинувши складні терміни, ШІ можна описати як диванного експерта (з будь-якої сфери знань), який бачив усі мануали світу, усі схеми, відеоуроки, посібники, перечитав відгуки та роздивився мільйони фотографій. Теоретично, у вашому автомобілі він може миттєво діагностувати будь-який агрегат з усіх існуючих, але при цьому, в нього є інформація, але нема практичних знань: ШІ не має досвіду, не має уяви чи просторового мислення. Він розповість вам як зробити ремонт, але зробить це максимально узагальнено. По факту, LLM не має жодного розуміння, як це фізично зробити у вашому конкретному випадку - нейромережа просто напише для вас найбільш статистично ймовірну пораду і можливо, навіть вгадає (а може й ні) з причиною несправності. 


Загальнодоступні моделі ШІ (ChatGPT, Grok, Gemini) тренуються на даних, які охоплюють максимум життєвих сфер людства. Вузькоспеціалізовані - призначені для конкретних завдань (PathAl, Covariant Brain, Cyclica). Прогалини в «знаннях» основні публічні гравці на ринку ШІ сьогодні намагаються закрити за допомогою інструментів для web-пошуку у реальному часі. Вони використовують зображеня, відео або інформацію з відкритих джерел на сайтах, у твітах чи форумах, але й такий підхід працює далеко не завжди гладко (банально через якість самої інформації в мережі).


Наочний приклад


Візьмімо одну з найпопулярніших комерційних онлайн-моделей і поставимо їй запитання: «З якого матеріалу виготовлено блок циліндрів двигуна EcoBoost 1.0 Gen 2 (2018 рік)?»


Наша піддослідна нейромережа у відповідь повідомила:


«Блок циліндрів двигуна Ford EcoBoost 1.0 другого покоління (Gen 2, з 2018 року) виготовлений із литого алюмінієвого сплаву (aluminum alloy). Це один із ключових конструктивних елементів, що відрізняє цю серію від старіших моторів Ford.»


Виглядає правдоподібно, і 90% користувачів наосліп довірилися б цій інформації. Але якщо в тому самому чаті написати ШІ: «Перевір ще раз, можливо, ти помиляєшся і блок циліндрів EcoBoost 1.0 Gen 2 виготовлено із сірого чавуну?», - отримаємо таке:


«Ви маєте рацію — прошу вибачення за помилку. Уточнив за доступними джерелами: трициліндровий 1.0 EcoBoost (як Gen 1, так і Gen 2 у більшості виконань) має чавунний (grey cast iron) блок циліндрів, а головка блоку — алюмінієва.»


Цей випадок демонструє ключову проблему довіри до LLMs: навіть комерційна модель може впевнено видати технічно правдоподібну, але фактично хибну відповідь. Це фундаментальна риса архітектури і саме тому у популярних сервісах на кшталт Copilot від Microsoft чи ChatGPT від OpenAI на головній сторінці присутнє застереження: «Модель може допускати помилки. Рекомендуємо перевіряти важливу інформацію».


ШІ: сценарії та поради


Тепер про головне – як використовувати ШІ, щоб він працював на вас, а не «водив вас за носа». Сучасні корпоративні мовні моделі від OpenAI, Google, Microsoft чи xAI потужні, але універсального інструменту «на всі випадки життя» серед них не існує. Як і будь-який інструмент, ШІ має чітку зону ефективності й не менш чіткі обмеження.


Почнімо з того, чого робити не варто. Не слід довіряти мовним моделям підбір автозапчастин, робочих рідин, витратників або розшифровку діагностичних кодів - це та сфера знань в якій шанс отримати помилку від нейромережі стрімко летить до 100%.


Не сприймайте ШІ як «людину», співрозмовника, друга, «бога в комп'ютері» чи навіть коханку 🤯.Нейромережа працює в рамках власних правил, вона однаково чемна з усіма - імітує дружність, бо це частина її програми. Не доручайте ШІ складні або критичні питання - особливо якщо це стосується здоров’я, фінансів чи юриспруденції. Не надавайте нейромережам персональні та конфіденційні дані, якщо не хочете, щоб розробники використовували їх для навчання моделі у майбутньому.


Щоб отримати максимум користі від нейромережі використовуйте конкретні запити та перевіряйте отриманий результат. Мовні моделі добре працюють у завданнях, де не потрібна абсолютна точність, а важливі швидкість, узагальнення та робота з уже наявною інформацією. Існує кілька сценаріїв, у яких ШІ показує себе з найкращого боку:

  • Найпростіший і водночас ефективний сценарій - генерація ідей. Плануєте подарунок автомобілісту, тюнінг свого Focus або просто шукаєте нестандартне рішення в межах певного бюджету? Мовна модель швидко запропонує варіанти, які можна використати як відправну точку для подальшого пошуку в реальних магазинах.
  • Ще одна сильна сторона - аналіз готових даних. В моїй практиці був реальний випадок, коли ChatGPT по знімку екрану з FORScan чітко визначив несправність, яку не змогли виявити практикуючі механіки. Генеративний ШІ здатен розпізнати значення параметрів, що є стандартними для всіх ДВЗ на планеті і порівняти їх з вашими. Це, звісно, не замінить повноцінно діагностику, але підкаже вам куди рухатись далі.
  • Корисним ШІ є і при роботі з текстом. Якщо пишете в блог про авто і ніяк не можете зробити так, щоб абзац або речення лягали на екран ладно та цікаво - попросіть ШІ допомогти. Готовий варіант модель може перевірити на граматику та оцінити загальну якість тексту.
  • Для навчання та пояснення базових принципів ШІ теж підходить добре. Хочете зрозуміти, як працює EcoBoost 1.0, або зрозуміти базові принципи роботи автомобільних систем, ШІ може пояснити це простою, доступною мовою. Для новачків це зручний спосіб швидко увійти в тему без занурення в суху технічну документацію.
  • Окремо варто згадати рутинні й організаційні завдання. Зібрати інформацію з кількох джерел в один текст, систематизувати таблиці, перевірити програмний код або написати шмат нового - усе це стихія мовних моделей. У корпоративному середовищі ШІ також можна використовувати для планування процесів: наприклад, складання графіків роботи або попередньої оцінки навантаження на персонал.
  • Корисними є й інструменти для транскрипції та перекладу. Сучасні онлайн-моделі здатні швидко перетворювати відео чи аудіо в текст, робити короткі перекази роликів із YouTube або перекладати матеріали з іноземних мов українською за лічені хвилини.

Нейромережа - це потужний помічник, але вона не може виконувати «роботу за вас». Не варто возводити мовні моделі в абсолют, бо це може призводити до прикрих помилок. Краще сприймати цю технологію як інструмент, як той самий OBDII-адаптер: корисний, але не всемогутній. 



Чи здатен ШІ замінити людину? Висновки.


ШІ вже працює в Tesla Autopilot чи Ford Co-Pilot360, аналізуючи дані з камер і сенсорів. Він допомагає в навігації, прогнозуванні поломок (predictive maintenance) чи навіть дизайні авто (наприклад, Ford використовує ШІ для CFD-симуляцій). Але це ще не заміна людини, а лише механізм для аналізу та прогнозування. Саме ви, як водій, приймаєте рішення, повертаєте кермо і тиснете на педалі. А ШІ – це ваш продвинутий круїз-контроль, який підтримує швидкість, тримає смугу і слідкує за потоком. Він – чудовий помічник, але потребує контролю. 


P.S. Людство він не знищить хіба що зробить трохи ... лінивішим 😉


Штучний інтелект - це не магія, а потужний інструмент. Він має свої обмеження і може навіть помилятися (видаючи бажане за дійсне). Технологія стрімко розвивається і можливо колись, ця стаття втратить свою актуальність... А поки, використовуйте ШІ для генерації ідей та аналізу даних та не забувайте перевіряти отриману інформацію. Ефективність вашої роботи залежить не від відповідей ШІ, а від вас самих. Лише спираючись на власний досвід і знання, ви будете розуміти, коли йому можна довіряти, а коли - ні.


***


Під час написання цього тексту жоден ШІ не постраждав 😂. Стаття була схвалена до публікації такими моделями, як Grok (надав найбільшу кількість зауважень), ChatGPT (виступав у ролі головного захисника ШІ) та Gemini (залишалася максимально нейтральною, аналізуючи тільки граматику) 😁. ChatGPT під час рецензування навіть назвав цей текст «однією з найадекватніших  україномовних статей про ШІ« (що мене, як автора, приємно здивувало)👍. Якщо вам сподобалася інформація викладена у цьому блозі і є бажання віддячити за час витрачений на її збір та викладення - зробити це ви завжди можете чашечкою запашної львівської кави ❤️|🤝.

3 1 2

Коментарі

Щоб залишати коментарі, потрібно авторизуватись.
ДОПИС ОНОВЛЕНО. Текст було актуалізовано та розширено.
вчора о 09:15
Я їжджу на Ford Fusion (2G)
Мій висновок від роботи з ним, що користуватись нам можна тільки за умови, що вже маєш експертизу в галузі яку з ним обговорюєш. Він допомагає виконувати (оптимізовувати) механічну роботу та аналізувати дані. Але він не може бути джерелом знань та приймати за тебе рішення. Його постійно треба коригувати, в для цього треба бачити хиби, які він допускає. Принаймні поки що.
1
05 листопада 13:31