Um grupo de estudantes de ciência da computação criou um sistema que identifica potenciais abusadores de crianças ao analisar textos de conversas na web. Com taxa de 85% de acerto, o mecanismo é único no mundo, segundo os autores, orientados pelo professor Rodrigo Filev Maia.
A tecnologia seria útil para pais que quisessem analisar conversas feitas a partir do computador ou do celular dos filhos, diz o docente do centro universitário FEI, em São Bernardo do Campo (Grande São Paulo), em que foi desenvolvido o projeto.
"Como você pode proteger seus filhos quando navegam na internet? É impensável falar em isolá-los digitalmente", diz Maia, que buscou alunos dispostos a trabalhar no tema após ficar aflito sobre a segurança on-line dos filhos, que têm quatro e sete anos.
O algoritmo, criado inicialmente para funcionar em inglês e que será adaptado para o português na segunda fase do desenvolvimento, capta padrões geralmente usados pelos "predadores" que procuram atrair crianças.
Palavras de cunho sexual, termos como "garoto" ou "garota", "querido" e algumas sequências específicas podem identificar o interlocutor como potencial agressor, explica um dos estudantes que desenvolveu o sistema, Gabriel Lett Viviani, 22.
"O método mapeia as conversas em forma de rede e, depois, analisa essa rede", diz Viviani. "A métrica que usamos dá pontos para quantificar a relevância de cada palavra dentro da conversa."
TEMPO REAL
O algoritmo difere dos atuais sistemas de varredura por funcionar em tempo real —em vez de ler o que já foi postado—, de acordo com o professor Maia, que tem a intenção de aplicá-lo tanto em PCs como em smartphones.
Viviani diz que um problema que o projeto apresenta atualmente é a alta taxa de falsos positivos —casos em que conversas de não agressores são apontadas como problemáticas. "Mas nesse caso é muito melhor detectar um inocente que deixar passar um agressor", afirma.
O projeto usou como base 5.000 conversas verdadeiras em inglês e de diversos teores (propagandas, conversas em grupo e bate-papo sensual entre adultos), que foram coletadas por uma universidade alemã, a Bauhaus-Universität Weimar, para estudos do tipo. O banco foi liberado para os brasileiros desenvolverem sua ferramenta.
Levando em conta todo o banco, entre 500 e 600 registros "inocentes", foram tomados como de potenciais agressores, conta Viviani. Em ambiente real, esses falsos positivos, conta, deveriam ser analisados por uma pessoa, que teria a palavra final.
O programa foi feito como trabalho de conclusão dele e de outros três alunos.
Já formados, ele e os demais —Gabriel Dias, 22, Gabriel Martinez, 21, e Ítalo Ferreira, 24— serão mentores de estudantes que levarão o projeto para suas próximas fases, junto com o professor Filev Maia, que acredita que até 2016 o algoritmo deve ser aplicado na prática.
-
PC VS PREDADOR
Como funciona o algoritmo de detecção de abusadores infantis criado por estudantes
- A conversa passa por um programa que "quebra" os diálogos em partes
- Um banco de dados armazena os termos e compara a conversas "culpadas" e "inocentes"
- O software dá notas para os textos oriundos dos chats e acusa positivo ou negativo
.