Наверное, каждому знакома ситуация, когда вы прочитали что-нибудь в Интернете, поделились этим в своих социальных сетях, а потом вдруг узнали, что информация была недостоверной.
Для тех, кто проводит много времени перед экраном компьютера, важно знать, насколько надежным источником новостей является Интернет.
Какое влияние оказывают на нас фейковые новости
Исследование, проведенное в Соединенном Королевстве, показало, что около двух третей опрошенных взрослых регулярно читают новости в Facebook и что половина из них попадали в ситуацию, когда они верили информации, которая впоследствии оказывалась ложной. Еще одно исследование, проведенное учеными Массачусетского технологического института, было сосредоточено на проблемах влияния фальшивых новостей. Оно показало, что в среднем читатели верят лживым новостям под броскими заголовками по крайней мере в 20% случаев.
Сейчас фальшивая информация распространяются в 10 раз быстрее, чем правдивые новости, и проблема фейковых новостей серьезно угрожает нашему обществу.
Например, во время выборов 2016 года в США огромное количество американских граждан поверили и поделились в соцсетях заведомо ложной информацией о том, что Хилари Клинтон была связана с преступной группировкой, занимавшейся торговлей людьми, через владельца популярной пиццерии. Хозяину ресторана угрожали расправой, в ресторане появился мужчина с пистолетом, который поверил в фейковую новость и решил разобраться со «злодеями» по-своему. Лишь чудом никто не пострадал в тот раз. Эта и ряд других фальшивых новостей, распространявшихся в период выборов, оказали неоспоримое влияние на результаты голосования населения.
Часто бывает трудно найти источник происхождения ложной информации после того, как социальные медиа-боты и друзья друзей тысячи раз поделились ею. Технологии, лежащие в основе Интернета и социальных сетей, способствуют распространению такой дезинформации. Возможно, пришло время спросить, что эта самая технология может предложить для решения этой проблемы.
Что выдает фейковую новость
Современные достижения позволяют компьютерам мгновенно выполнять задачи, на которые у человека ушло бы гораздо больше времени. Например, существуют компьютерные программы, которые помогают полиции в считанные секунды распознать лица преступников. Эти программы знакомы с алгоритмами классификации, обнаружения и принятия решений.
За последние несколько лет ученые, занимающиеся изучением стилей речи, стали более активно разрабатывать алгоритмы обнаружения дезинформации и создавать технологии, способные помочь нам распознавать фальшивую информацию.
Один из подходов заключается в поиске соответствующих источников информации, присвоении каждому источнику оценки достоверности и последующем их объединении для подтверждения или опровержения того или иного сообщения. Такой подход в значительной степени зависит от отслеживания первоисточника новостей и оценки их достоверности на основе целого ряда факторов.
Второй подход исследует стиль написания новостей, а не их происхождение. Лингвистические особенности написанного материала могут многое рассказать нам об авторах и их мотивах.
Обнаружение фейковых новостей
Анализ большого количества проверенных на практике новостных статей на различные темы показывает, что в среднем в поддельных новостях используется больше агрессивных высказываний, а также слов, относящихся к сексу, смерти и страху. Правдивая новость, с другой стороны, содержит большую долю слов, относящихся к работе (бизнесу) и деньгам (экономике).
Это говорит о том, что стилистический подход в сочетании с алгоритмами машинного обучения может быть полезным для выявления подозрительных новостей.
Детектор фальшивых новостей создан на основе лингвистических характеристик, взятых из большого количества новостных статей. Он выбирает фрагмент текста и анализирует, насколько он похож на фейковые новости и реальные новости, с которыми ему приходилось сталкиваться раньше.
Основная проблема, однако, заключается в создании системы, способной обрабатывать самые разнообразные новостные темы и быструю смену заголовков в Интернете, поскольку компьютерные алгоритмы учатся на примерах, и если эти примеры недостаточно наглядны, то возможны ошибки в распознавании ложных новостей в Интернете.
Нужны специалисты для сбора и маркировки большого количества фейковых и реальных новостей. Данные, собранные ими, позволят алгоритму машинного обучения находить общие черты, что позволит с уверенностью отличать правдивые новости от фейковых.