О. Шевчук-Клюжева: об украиноязычном ChatGPT

Искусственный интеллект не может с нами корректно взаимодействовать на украинском, потому что ему просто не хватает слов

О. Шевчук-Клюжева: об украиноязычном ChatGPT

Автор: Ольга Шевчук-Клюжевасоциолингвистка, языковед, исследователь Института славистики Польской Академии Наук.

Що не так із українськомовною версією ChatGPT? І до чого тут лінгвістика?

Компанія-розробник анонсує, що на цьому тижні з’явиться оновлена версія ChatGPT, яка буде у 500 разів потужніша за поточну…

Дуже дивно читати, що багатьох не влаштовує українськомовна версія, адже, на мою думку, це величезна удача, що вона взагалі є. Складна робота алгоритмів штучного інтелекту зі створення текстів передбачає взаємодію з корпусом (корпусами) мови, а в українській мові з цим певні проблеми.

За офіційними даними, всі доступні корпуси української мови налічують менше 500 мільйонів слів, а саме – 416. Корпуси англійської мови мають орієнтовно 3 мільярди слів: British National Corpus, Corpus of Contemporary American English, Corpus of Historical American English, Corpus of American Soap Operas, Australian National Corpus.

На створення кожного з цих англомовних корпусів було витрачено мільйони доларів, накопичення і обробка даних забирала в часі роки. У всіх цих фінансово потужних і тривалих проєктах були присутні державні інституції, які здійснювали співфінансування або повністю фінансували активності зі створення корпусів, планували роботу, залучали фахівців.

Повертаючись до конкретної версії ChatGPT і використання для роботи української мови, то, на жаль, ми просто не можемо побачити всі його можливості. Це як порівнювати потужний автомобіль і самокат – обидва транспортні засоби, в принципі, рухаються, але є багато запитань до такого нерівнозначного руху.

Штучний інтелект не може з нами коректно взаємодіяти українською, бо йому просто не вистачає слів…

І поки частина українців вперто намагається співпрацювати зі штучним інтелектом, як із учнем початкової школи, апріорі вважаючи, що ото залізяччя все ж таки варто навчити чомусь, наприклад, давати однозначні відповіді на запитання з множинним вибором, або навіть деяким нормам української мови, хочеться вірити, що в Україні розуміння важливості державної мови буде в перспективі вимірюватися кількістю зреалізованих проєктів і вкладених у її розвиток грошей, а не лише «стратегіями підтримки».

В Україні є ціла низка важливих лінгвістичних питань чи проєктів, які потребують реалізації із залученням насамперед держави. Зрозуміло, що найважливіші – це корпус та сертифікація української мови як іноземної…

Насправді цих питань можна назвати набагато більше – це стосується і стандартів мови, і сучасних словників, і багато чого іншого, що належить до сфери державної мовної політики і планування. Ці питання всі пов’язані між собою, і на жаль чи на щастя, але вони не можуть бути просто науковим інтересом окремих лінгвістів, бо мають саме державне значення.

Тому трішки сумно стає, що риторика важливості державної мови часто зводиться до… Ну ви, друзі, самі знаєте, до чого…

Будемо сподіватися на зміни, що нам ще робити?! А поки для розв’язання реальних робочих завдань через ChatGPT варто використовувати англійську мову і пам’ятати про те, що релевантність відповідей залежить від формулювання запитів.

Оригинал

Освіта.ua
14.03.2023

Популярные блоги
А. Мирошниченко: родители не враги учителям Для родителей проблемы образовательной системы не самое главное дело в жизни
В. Онацкий: какие предметы исчезнут из расписания? Каждый пытается найти рецепт лечения образования, хотя к школе имел отношение, только будучи школьником
И. Ликарчук: образование выжило благодаря учителям Популизм и дилетантство в образовании разрушают педагогическое творчество и производят учителя-урокодателя
Т. Гориха Зерня: роль учителя становится определяющей Реформа, по сути, потребует полной профессиональной переподготовки всего преподавательского состава
Комментарии
Аватар
Осталось 2000 символов. «Правила» комментирования
Имя: Заполните, или авторизуйтесь
Код:
Код
Нет комментариев