Сигнал собачьей свистка — это закодированный язык в комментариях, который кажется невинным для большинства читателей, но несет скрытое ненавистное, политическое или дискриминационное значение, понятное определенной группе.
В модерации социальных сетей сигнал собачьей свистка относится к слову, фразе, числу, последовательности эмодзи или символу, который кажется безобидным для случайных читателей, но несет скрытое значение, понятное определенному сообществу — часто ненавистное, дискриминационное или политически экстремальное. Сигналы собачьей свистка специально разработаны, чтобы избежать модерации на основе ключевых слов: буквальный текст не содержит никаких запрещенных слов, но значение явно враждебно для тех, кто понимает код. Сигналы собачьей свистка быстро эволюционируют, поскольку системы модерации догоняют, создавая постоянную гонку вооружений между закодированным языком и обнаружением.
Сигналы собачьей свистка в разделах комментариев брендов особенно опасны, потому что они создают враждебную среду, которую команда модерации бренда может не распознать. Распространенные паттерны включают: числовые коды, связанные с группами ненависти, последовательности эмодзи, которые несут закодированные значения, казалось бы нейтральные фразы, которые на самом деле являются враждебными мемами, и исторические ссылки, которые служат закодированными атаками. Поскольку буквальный текст безобиден, фильтры на основе ключевых слов бесполезны.
Обнаружение "собачьих свистков" требует ИИ, который понимает культурный контекст, а не только ключевые слова. Фильтр по ключевым словам не может поймать "собачий свисток", потому что отдельные слова не помечены — враждебность заключается в комбинации, контексте и культурном коде. Классификатор FeedGuardians обучен на постоянно обновляемых наборах данных известных паттернов "собачьих свистков" на нескольких языках и субкультурах и переобучается каждую неделю, чтобы успевать за новыми кодами.
Определенная последовательность эмодзи — невинная по отдельности — воспринимается в сообществе преследования как дискриминационная ругань. Эта последовательность повторяется в разделе комментариев создателя. Фильтры по ключевым словам не могут ее поймать, потому что слов нет. Только ИИ, осознающий контекст, распознает этот паттерн.
Нет. "Собачьи свистки" специально созданы для обхода фильтров по ключевым словам. Отдельные слова или символы безобидны — враждебность заключается в закодированном значении. Только ИИ, который понимает культурный контекст и эволюцию паттернов, может обнаружить "собачьи свистки".
Классификатор переобучается каждую неделю на новых паттернах закодированного языка от организаций по мониторингу ненависти, отчетов о прозрачности платформ и наших собственных данных по обнаружению среди клиентов. Новые "собачьи свистки" обычно становятся обнаружимыми в течение 1-2 недель после появления.
Начните свою бесплатную пробную версию и испытайте модерацию комментариев на основе ИИ, начиная с $39 в месяц.
Начать бесплатную пробную версию7-day free trial
Изучить больше