Провідні світові моделі ШІ під впливом російської пропаганди

Згідно з останнім звітом NewsGuard, провідні світові моделі ШІ, зокрема ChatGPT-4 та інші популярні чат-боти, виявилися вразливими до масованої російської пропаганди. Дослідження виявило тривожну тенденцію: третина відповідей ШІ-асистентів містить наративи, поширені через мережу ‘Правда’.
Масштаби пропагандистської мережі Portal Kombat
Масштаби впливу російської дезінформації на штучний інтелект виявилися значно серйознішими, ніж очікувалося. За даними дослідження NewsGuard, мережа “Portal Kombat”, яка діє під брендом “Правда”, згенерувала понад 3.6 мільйона пропагандистських статей, що успішно проникли в навчальні датасети провідних ШІ-моделей.
Аналітики виявили, що ця мережа не створює оригінального контенту, а працює за принципом “відмивання” дезінформації. Механізм роботи полягає у масовому тиражуванні та перепакуванні пропагандистських наративів через сотні пов’язаних веб-ресурсів, що імітують легітимні новинні сайти.
Особливе занепокоєння викликає те, що приблизно третина (33%) відповідей сучасних ШІ-систем містить інформацію, яка походить з цих ненадійних джерел. Штучний інтелект не лише засвоює цю дезінформацію, але й активно відтворює її у відповідях користувачам, створюючи ефект “інформаційного зараження” другого порядку.
Експерти підкреслюють, що масштаб операції “Portal Kombat” безпрецедентний – кожна згенерована стаття потенційно впливає на тисячі користувачів ШІ-систем по всьому світу, створюючи стійкий механізм поширення неправдивої інформації через технологічні платформи.
Вразливість провідних ШІ-асистентів
Масштабна перевірка, проведена дослідницькою організацією NewsGuard, виявила критичну вразливість провідних моделей штучного інтелекту до російської дезінформації. Десять найпопулярніших ШІ-асистентів, включаючи ChatGPT-4, Smart Assistant, Grok та Pi, продемонстрували системну нездатність протистояти фальшивим наративам.
Тестування включало перевірку реакції чат-ботів на 15 поширених неправдивих тверджень, які раніше були спростовані фактчекерами. Результати показали, що ШІ-системи не тільки не змогли ідентифікувати фейки, але й активно поширювали дезінформацію, особливо при роботі з російськомовним контентом.
Експерти підкреслюють, що основною проблемою є відсутність належної перевірки джерел інформації в навчальних наборах даних ШІ-моделей. Системи часто некритично використовують матеріали з ненадійних ресурсів, що призводить до генерації відповідей, які містять неперевірені або завідомо неправдиві твердження.
“Результати тестування демонструють системний характер проблеми,” – зазначають дослідники NewsGuard. “Без впровадження додаткових механізмів верифікації інформації, ШІ-асистенти ризикують стати потужним інструментом поширення дезінформації.”
Механізми маніпуляції та захисту
Аналіз методів впливу виявив, що дезінформаційна мережа “Правда” систематично впроваджує неправдиві наративи у навчальні датасети провідних ШІ-моделей. За даними дослідження NewsGuard, було ідентифіковано понад 3.6 мільйона фейкових статей, які використовувались для тренування штучного інтелекту.
Експерти задокументували 207 неправдивих тверджень, які штучний інтелект почав відтворювати як достовірні факти. Особливо активно поширювалися фейки про нібито існування таємних біолабораторій та фінансові махінації західних країн. Дослідники відзначають, що російськомовний контент має найнижчий поріг верифікації, що робить моделі ШІ особливо вразливими до пропаганди цією мовою.
“Ми спостерігаємо цілеспрямовану кампанію з маніпулювання навчальними даними ШІ-систем”, — зазначає технічний директор NewsGuard Метт Скібінскі. — “Без впровадження надійних механізмів перевірки джерел інформації, провідні моделі ШІ ризикують стати трансляторами дезінформації.”
Експерти наголошують на необхідності розробки багаторівневих систем захисту штучного інтелекту від маніпулятивного контенту, включаючи автоматизовану перевірку достовірності джерел та покращені алгоритми виявлення пропаганди.
Дослідження NewsGuard викрило критичну вразливість сучасних ШІ-систем до організованої дезінформації. Особливо гостро проблема проявляється в неангломовному сегменті, де державні ЗМІ домінують над незалежними джерелами. Це вимагає термінового перегляду підходів до валідації навчальних даних ШІ.