Відомий науковий журнал Science оголосив, що всі його видання використовуватимуть комерційне програмне забезпечення, яке автоматизує процес виявлення підозрілих зображень. У свій час перехід до цифрових даних та публікацій значно полегшив шахрайство у дослідженнях за допомогою підробки зображень.
Хоча ПЗ має певні обмеження, воно дозволить відшукати значу частку маніпуляцій з зображеннями. Велика частина шахрайств з зображеннями викликана невідповідністю реальних експериментів теоретичним висновкам та здогадкам. Часто експерименти дають дані, які практично неможливо відрізнити від контрольних. Для неетичних людей це не становить проблеми – ніхто не знає, які зображення відповідають тим чи іншим зразкам. Відносно просто зробити тенденційне викривлення.
Тож зображення зразків одних експериментів комбінують з іншими, фабрикуючи «докази». Це можна робити з графіками, фотографіями та будь-якими графічними даними. Одні й ті ж самі елементи у різних графічних зразках, хай навіть дещо змінені у редакторах, відносно просто побачити, якщо про них знати, але без цього вони практично непомітні.
Не надто ретельна підробка зображень доволі поширена, автоматичні засоби її розпізнавання на основі ШІ чудово виконують своє завдання. Це стало причиною, чому Science звернувся до сервісу Proofig для полегшення виявлення фальшивок.
Система використовує поєднання порівняльних алгоритмів, нейромереж та ШІ для пошуку у текстах зображень, що можуть бути фальсифіковані, схожих елементів на різних зображеннях, комбінованих зображень та окремих їхніх частин. Як це завжди відбувається з ШІ, іноді система «не знає» критеріїв, за якими відбувається ідентифікація.
Незалежно від того, як усе зроблено, кінцевим результатом є звіт, який демонструє потенційну подібність у різних малюнках та ступінь збігу. Далі вже редактори вирішують, що робити з отриманими даними..
У Science редактори спочатку перевірятимуть, чи є проблема взагалі. У багатьох випадках частини зображень збільшуються та обрізаються, щоб забезпечити детальний перегляд ключових особливостей. Якщо очевидного пояснення дублювання частин зображень немає, редактори Science попросять авторів статті пояснити проблему. Попри те, що цифри не наводяться, Science вказала, що протягом випробувального періоду більшість авторів надавали пояснення щодо проблем і вносили виправлення перед публікацією – але не всі. «Було виявлено статті, які не слід публікувати», — каже Холден Торп, головний редактор журналів Science.
Якщо будуть виявлені серйозні проблеми, це може свідчити про випадки більш масштабних порушень у дослідженнях, які можуть виходити за рамки однієї публікації. Science планує звертатися до установ, у яких працюють дослідники, у випадках серйозних маніпуляцій із зображеннями. Видавництво веде облік усього листування, пов’язаного з рукописами, поданими до наукових журналів та контролюватиме подальшу діяльність у Science «проблемних» авторів.
Треба зауважити, що Proofig не виявить жодних проблем, які не передбачають дублювання даних. Наприклад, одну нещодавню статтю про високотемпературну надпровідність було відкликано, оскільки дослідник не міг пояснити математичні перетворення, які виконувалися з даними перед побудовою графіку.
У того ж самого дослідника було відкликано іншу статтю, оскільки один із графіків був скопійований з його дипломної роботи, де виник внаслідок непов’язаного експерименту. Для виявлення подібного потрібно було б створити базу даних з усіма зображеннями з усіх наукових публікацій – це практично неможливо. І навіть це не допомогло б з найпростішим обхідним шляхом: якщо хтось збирається фальсифікувати дані, для цього можна використовувати неопубліковані ніде зображення.
Нова система розпізнавання фальсифікацій не стане панацеєю від них, але принаймні допоможе зменшити їхню кількість.
Науковий журнал Nature заборонив публікувати статті із зображеннями та відео, які згенерував ШІ
Джерело: Ars Technica
Adblock test (Why?)