На платформі X (раніше Twitter) активно впроваджується інструмент Community Notes, який покликаний боротися з вірусною дезінформацією. Ця система використовує колективне судження користувачів з різними політичними поглядами для надання контексту до постів, зменшуючи поширення фейкових новин та AI-згенерованого контенту. Основна мета – створення більш поінформованого світу шляхом надання точної інформації.
Community Notes працює як механізм, що дозволяє користувачам додавати контекст до постів, які можуть бути неточними або вводити в оману. Прикладом є пост про пошкодження військового корабля та наявність жертв, що виявився AI-згенерованою картинкою. Доданий контекст розкривав деталі щодо невідповідності зображення, що викликало більшу довіру, ніж стандартні попередження про фейки.
Читайте також: Українська компанія "Узол" виводить на ринок сервісних роботів "Ліра" та AI-агентів
Принцип роботи та довіра користувачів
Зазначається, що нотатки створюються звичайними користувачами, а перед публікацією вони мають бути оцінені як корисні людьми з різних точок зору. Це гарантує, що нотатки відображають консенсус, а не думку однієї групи. Ефективність Community Notes полягає не лише у виявленні фактчекінгу, але й у наданні контексту до правдивих, але потенційно оманливих повідомлень. Програма відкрита для всіх типів публікацій, включаючи пости від глав держав та офіційних акаунтів.
Система також ефективно виявляє AI-згенеровані зображення та діпфейк-аудіо, що стало особливо актуальним на тлі конфлікту в Ірані. Були випадки, коли нотатки, створені пересічними користувачами, спонукали адміністрацію Білого дому до видалення постів та оновлення заяв. Це описується як «суперсила» для звичайних людей, що мотивує їх до участі.
Витоки ідеї та подолання проблем
Ідея Community Notes зародилася у 2016 році під час президентських виборів у США, коли було важко відрізнити правдиву інформацію від фейків у соціальних мережах. Попередні спроби боротьби з дезінформацією, такі як робота з фактчекерами та створення внутрішніх команд, мали проблеми зі швидкістю (відповіді займали дні), масштабованістю (обмежена кількість перевірок на день) та довірою (небажання користувачів покладатися на рішення технологічних компаній).
Ключовим принципом Community Notes є прозорість та відкритість. Користувачі можуть завантажити код алгоритму та дані для перевірки. Відсутність кнопки «перекриття» (override button) означає, що система не підлягає втручанню ззовні, а рішення приймаються спільнотою. Нотатки, які вважаються корисними більшістю, навіть якщо вони походять від людей з протилежними поглядами, відображаються на платформі.
- Прозорість: Можливість завантажити код алгоритму та реальні дані для перевірки.
- Відсутність втручання: Немає можливості примусово видалити або змінити нотатку.
- Механізм згоди: Відображення лише тих нотаток, які визнані корисними людьми з різних політичних поглядів.
- Система репутації: Користувачі, що створюють багато неякісних нотаток, можуть втратити право участі.
Вплив на поширення контенту та боротьба з маніпуляціями
Аналіз показує, що пости, до яких додано нотатки, значно втрачають у поширенні. Цей ефект є результатом органічної поведінки користувачів, які, побачивши контекст, знижують зацікавленість у поширенні такого контенту. Дослідження також підтверджують, що додавання нотаток призводить до зниження згоди з основними твердженнями посту. Хоча автори постів можуть видаляти свої повідомлення після отримання нотатки, це розглядається як позитивний сигнал, що свідчить про ефективність механізму.
Незважаючи на ефективність, залишається питання потенційних маніпуляцій системою, зокрема з використанням AI-ботів. Для протидії цим загрозам впроваджуються додаткові заходи безпеки, такі як вимога верифікованих телефонних номерів, аналіз схожості оцінок від користувачів та система репутації. Навіть у разі появи некоректних нотаток, система має самокоригувальний механізм, коли такі нотатки швидко отримують негативні оцінки і перестають відображатися.
Інтеграція AI та майбутнє Community Notes
Для прискорення процесу створення нотаток та розширення можливостей системи, X відкрив API для AI-контриб'юторів. Це дозволяє AI створювати перші версії нотаток, які потім верифікуються людьми. Такий підхід сприяє швидшому виявленню помилок AI та покращенню моделей шляхом навчання на зворотній зв'язку від користувачів. Мета – створити систему, де AI та люди співпрацюють для генерації якісного та своєчасного контексту.
Розглядається також можливість використання схожого механізму для виявлення тем, щодо яких існує згода між людьми з різними поглядами, а не лише виявлення розбіжностей. Такий «двигун спільної основи» може сприяти зменшенню поляризації та формуванню більш конструктивного діалогу. На прикладі пілотного проєкту показано, як ідеї, що подобаються людям з різних кутів зору, можуть бути виділені, стимулюючи спільні інтереси та потенційно впливаючи на політичні процеси, як-от під час законодавчих дебатів.
«My hope is, with programs like this, if we can identify common ground at internet scale, it'll make it a lot easier to create a future that humanity likes.» — Keith Coleman.
Читайте також: Ринок праці в IT: кого звільняють, хто боїться втратити роботу, а хто шукає нові можливості