У Nature вийшов матеріал про небезпечну тенденцію: відкриті дані та генеративний ШІ використовують для масового продукування низькоякісних «копіпаперів» – наукових статей-близнюків.
Дослідники проаналізували базу PubMed і виявили 411 майже ідентичних робіт, створених на основі даних NHANES. Часто це «повтори» вже опублікованих асоціативних досліджень – з мінімальними змінами у вибірках (інші роки, стать, вік).
ChatGPT і Gemini легко переписують статті так, що вони обійшли стандартні антиплагіатні системи. На створення «нової» публікації вистачає кількох годин редагування.
Відкриті дані залишаються критично важливими, але їхня комбінація з LLM без належного контролю створює ризик потопу низькоякісних, повторних публікацій, які псують науковий ландшафт. Редакції та наукова спільнота терміново шукають рішення.
У нашій статті Small Is Sexy: Rethinking Article Length in the Age of AI ми вже підкреслювали: поява мовних моделей вимагає переоцінки академічних форматів. Коротші тексти, відкриті репозитарії для деталей, якість замість кількості – це не просто тренд, а виживальна стратегія для науки.
Сьогоднішня ситуація показує ще більше: детектори ШІ та антиплагіатні сервіси – це вже минуле. Вони не захищають від масового виробництва «копіпаперів». Поки що єдиним інструментом лишається прозоре розкриття внесків ШІ, але цього замало.
Я впевнена, що академічне виробництво та написання письмових кваліфікаційних робіт найближчим часом потребуватимуть повного перегляду правил гри:
Тільки так ми зможемо протистояти потопу «синтетичної науки» й водночас зберегти довіру до справжніх досліджень.
Автор: Яна Сычикова, проректор по научной работе Бердянского государственного педагогического университета.
По материалам: Освіта.ua
Дата публикации: 01.10.2025