Інтернет вже на половину складається з витворів ШІ, — дослідження

Інтернет вже на половину складається з витворів ШІ, — дослідження

Згідно зі звітом Axios, трохи менше половини усіх нових матеріалів в інтернеті були створені ШІ. 

З моменту запуску ChatGPT у листопаді 2022 року користувачі змушені миритись із нескінченним потоком мусору, який генерується штучним інтелектом. У звіті, оприлюдненому SEO-компанією Graphite, проаналізовано випадкову підбірку з 65 тис. англомовних статей, опублікованих з січня 2020 року по травень 2025. 

За допомогою детектора ШІ Surfer будь-який матеріал, у якому 50% та більше інформації було створено з використанням Великих мовних моделей, дослідники відносили до згенерованого штучним інтелектом. Аналіз продемонстрував стрімке зростання кількості публікацій, створених за допомогою ШІ. Це зростання збіглось з появою ChatGPT, збільшившись з 10% наприкінці 2022 року до 40% вже у 2024 році.

Однак зростання матеріалів, створених за допомогою ШІ, наразі досягло максимуму. Після досягнення піка у листопаді 2024 року, співвідношення матеріалів, створених людьми та згенерованих штучним інтелектом коливається приблизно порівну. Станом на травень 2025 року кількість нових матеріалів, створених за допомогою ШІ, досягла 52%. Існує ймовірність, що кількість матеріалів, написаних людьми, може бути вищою.

Інтернет вже на половину складається з витворів ШІ, — дослідження
Частка матеріалів, створених за допомогою ШІ у період з 2020 по 2025 рік/Graphite.io; Axios Visuals

Дослідники використали відкритий набір даних Common Crawl, що містить сотні мільярдів вебсторінок. Оскільки компанії, які займаються штучним інтелектом, використовували цей цінний ресурс для навчання своїх LLM, багато платних сайтів почали блокувати індексацію своїх сторінок Common Crawl. Таким чином, ці статті, майже точно написані людиною, не будуть включені в аналіз Graphite. 

У рамках тестування точності Surfer компанія Graphite проаналізувала вибірку статей, створених ШІ, і ще одну вибірку статей, написаних людьми. В результаті детектор виявив, що в 4,2% випадків статті, написані людьми, були позначені як створені ШІ (поширена проблема для цих інструментів), але лише в 0,6% випадків помилково приймав статті, написані ШІ за написані людьми.

Посилаючись на другий звіт Graphite, в Axios зазначають, що причиною зниження кількості матеріалів, створених за допомогою ШІ, може бути розуміння авторами такого контенту, що він низькоякісний і пошукові системи не будуть його активно поширювати. Компанія виявила, що 86% статей у пошуку Google написані людьми та лише 14% — ШІ. 

Джерела: Axios; Futurism

Adblock test (Why?)

Залишити відповідь