Um apito de cachorro é uma linguagem codificada em comentários que parece inocente para a maioria dos leitores, mas carrega um significado oculto, odioso, político ou discriminatório entendido por um grupo específico.
Na moderação de mídias sociais, um apito de cachorro refere-se a uma palavra, frase, número, sequência de emojis ou símbolo que parece inócuo para leitores casuais, mas carrega um significado oculto entendido por uma comunidade específica — frequentemente odioso, discriminatório ou politicamente extremo. Apitos de cachorro são deliberadamente projetados para evadir a moderação baseada em palavras-chave: o texto literal não contém palavras sinalizadas, mas o significado é claramente hostil para aqueles que entendem o código. Apitos de cachorro evoluem rapidamente à medida que os sistemas de moderação se atualizam, criando uma corrida constante entre a linguagem codificada e a detecção.
Apitos de cachorro nas seções de comentários de marcas são particularmente perigosos porque criam um ambiente hostil que a equipe de moderação da marca pode não reconhecer. Padrões comuns incluem: códigos numéricos associados a grupos de ódio, sequências de emojis que carregam significados codificados, frases aparentemente neutras que são na verdade memes hostis, e referências históricas que servem como ataques codificados. Como o texto literal é inócuo, filtros baseados em palavras-chave são inúteis.
A detecção de dog whistles requer IA que compreenda o contexto cultural, não apenas palavras-chave. Um filtro de palavras-chave não consegue identificar um dog whistle porque as palavras individuais não são sinalizadas — a hostilidade está na combinação, no contexto e no código cultural. O classificador da FeedGuardians é treinado em conjuntos de dados continuamente atualizados de padrões conhecidos de dog whistles em várias línguas e subculturas, e é re-treinado semanalmente para acompanhar os códigos emergentes.
Uma sequência específica de emojis — inocentes individualmente — é entendida dentro de uma comunidade de assédio como um insulto discriminatório. A sequência aparece repetidamente na seção de comentários de um criador. Filtros de palavras-chave não conseguem capturá-la porque não há palavras. Apenas IA ciente do contexto reconhece o padrão.
Não. Dog whistles são especificamente projetados para contornar filtros de palavras-chave. As palavras ou símbolos individuais são inócuos — a hostilidade está no significado codificado. Apenas IA que compreende o contexto cultural e a evolução dos padrões pode detectar dog whistles.
O classificador é re-treinado semanalmente com padrões de linguagem codificada emergentes de organizações de monitoramento de ódio, relatórios de transparência da plataforma e nossos próprios dados de detecção entre clientes. Novos dog whistles são tipicamente detectáveis dentro de 1-2 semanas após sua emergência.
Comece seu teste gratuito e experimente a moderação de comentários com IA a partir de R$39/mês.
Comece o Teste Gratuito7-day free trial
Explore Mais