Com IA, Ceweb.br desenvolve projeto para detectar discursos de ódio

As recentes publicações racistas no Facebook — que geraram o boicote de anúncios das grandes empresas na rede social — diante do assassinato de George Floyd evidenciaram o aumento de discursos de ódio na internet. E foi pensando em conter essas manifestações que o Centro de Estudos sobre Tecnologias Web (Ceweb.br), do Núcleo de Informação e Coordenação do Ponto BR (NIC.br), está anunciando um projeto para detectar expressões ofensivas com o uso de inteligência artificial.Ainda em fase inicial, o programa, que ainda conta com as parcerias da Pontifícia Universidade de São Paulo (PUC) e Queen Mary University of London, consiste na categorização de discursos de ódio na internet e na criação de um código (que trabalha com a linguagem Python) capaz de identificar declarações hostis expostas na rede.O código tem como base um modelo de processamento de linguagem natural, e foi parametrizado com um conjunto de orações para detecção de manifestações de ódio. “Com isso, o algoritmo consegue identificar possíveis sentenças que possam conter algum tipo de violação ou ofensas, como racismo, intolerância religiosa ou xenofobia”, afirma Diogo Cortiz, especialista do Ceweb.br e um dos desenvolvedores do código. codigo.jpgCom mais de 700 linhas, projeto do código está disponível na plataforma GitHub para que interessados possam contribuir. Foto: NIC/Reprodução Cortiz diz ainda que o projeto não tem o intuito de criar um sistema para retirada automática de conteúdos ou para investigações, e sim, explorar as potencialidades da inteligência artificial no uso da linguagem natural nas redes sociais para categorizar os diferentes tipos de declarações.Apesar de o projeto estar em fases introdutórias, Vagner Diniz, gerente do Ceweb.br acredita que o código será importante na compreensão do fluxo de informações das redes mundiais. “Ainda não sabemos se esse algoritmo em que estamos trabalhando compartilha de características como equidade, confiabilidade e segurança, obrigatórias em quaisquer algoritmos de inteligência artificial. É por isso que convocamos a comunidade de pesquisadores e desenvolvedores a se juntar a nós no desenvolvimento desse código”, frisa.Os interessados em acessar o projeto ou contribuir com o desenvolvimento do código podem visualizar o programa pelo perfil do cewebbr, no GitHub. É importante ressaltar que o código não é uma ferramenta pronta para uso. Pontos como validação do modelo e implementação de ferramentas adicionais na explicação do formato e na geração de um novo corpus de dados ainda precisam ser discutidos.Via: NIC.br
Share on facebook
Facebook
Share on linkedin
LinkedIn
Share on whatsapp
WhatsApp