Кто бот, а кто нет

Новое исследование в Frontiers in Physics показало наличие краткосрочных поведенческих тенденций у людей, которые отсутствуют в ботах социальных сетей, что является примером «человеческой подписи» в социальных сетях, которую можно использовать для разработки более сложных стратегий обнаружения ботов. Это первое исследование такого рода, в котором поведение пользователя во время сеанса в социальных сетях применяется к проблеме обнаружения ботов.
"Примечательно, что боты постоянно совершенствуются, чтобы имитировать все больше и больше того поведения, которое люди обычно демонстрируют в социальных сетях. Каждый раз, когда мы определяем характеристику, которая, по нашему мнению, является прерогативой человеческого поведения, например, отношение к интересующим темам, мы вскоре обнаруживаем, что недавно разработанные боты с открытым исходным кодом теперь могут улавливать эти аспекты », – говорит соавтор Эмилио Феррара, доцент кафедры Руководитель группы компьютерных наук и исследований Института информационных наук Университета Южной Калифорнии.

В этой работе исследователи изучили, как поведение людей и ботов изменилось в течение сеанса активности, используя большой набор данных Twitter, связанный с недавними политическими событиями. В ходе этих сессий исследователи измерили различные факторы, чтобы зафиксировать поведение пользователей, включая склонность к социальным взаимодействиям и объем производимого контента, а затем сравнили эти результаты между ботами и людьми.
Чтобы изучить поведение пользователей-ботов и людей в течение сеанса активности, исследователи сосредоточили внимание на показателях количества и качества социальных взаимодействий, в которых участвовал пользователь, включая количество ретвитов, ответов и упоминаний, а также длину твита. сам.

Затем они использовали эти поведенческие результаты, чтобы сообщить системе классификации для обнаружения ботов, чтобы увидеть, может ли включение функций, описывающих динамику сеанса, улучшить производительность детектора. Для обучения двух разных наборов классификаторов использовался ряд методов машинного обучения: один включает в себя функции, описывающие динамику сеанса, а другой – без этих функций, в качестве базового уровня.
Исследователи обнаружили среди людей тенденции, которых не было среди ботов: люди продемонстрировали увеличение количества социальных взаимодействий в течение сеанса, о чем свидетельствует увеличение доли ретвитов, ответов и количества упоминаний, содержащихся в твитнуть.

Люди также показали уменьшение количества создаваемого контента, о чем свидетельствует тенденция к уменьшению средней длины твита. Считается, что эти тенденции связаны с тем, что по мере прохождения сеансов пользователи-люди устают и с меньшей вероятностью будут выполнять сложные действия, такие как создание исходного контента.

Другое возможное объяснение может быть дано тем фактом, что с течением времени пользователи получают больше сообщений, что увеличивает их вероятность реагировать и взаимодействовать с контентом. В обоих случаях было показано, что такие соображения не влияют на ботов, и никаких изменений в их поведении не наблюдалось.
Исследователи использовали эти поведенческие результаты для информирования системы классификации для обнаружения ботов и обнаружили, что полная модель, включая функции, описывающие динамику сеанса, значительно превосходила базовую модель по точности обнаружения ботов, которая не описывала эти функции.

Эти результаты подчеркивают, что поведение пользователей в социальных сетях изменяется заметно по-разному между ботами и людьми в течение сеанса активности, а также предполагают, что эти различия могут быть использованы для реализации системы обнаружения ботов или для улучшения существующих.
Эмилио подчеркивает: «Боты постоянно развиваются – с быстрым развитием ИИ, можно создавать все более реалистичных ботов, которые могут все больше и больше имитировать то, как мы разговариваем и взаимодействуем на онлайн-платформах."
«Мы постоянно пытаемся определить параметры, которые характерны для поведения людей в социальных сетях, которые, в свою очередь, могут быть использованы для разработки более сложных инструментов для обнаружения ботов."