Banca de QUALIFICAÇÃO: FRANCISCO ASSIS RICARTE NETO
2024-04-20 12:31:12.176
Uma banca de QUALIFICAÇÃO de DOUTORADO foi cadastrada pelo programa. DISCENTE: FRANCISCO ASSIS RICARTE NETO DATA: 17/05/2024 HORA: 08:30 LOCAL: Sala virtual TÍTULO: Método baseado em Grafo Hetergêneo para construção de dataset de linguagem tóxica PALAVRAS-CHAVES: Linguagem tóxica, Detecção de linguagem tóxica, Corpus, Grafo heterogêneo. PÁGINAS: 43 GRANDE ÁREA: Ciências Exatas e da Terra ÁREA: Ciência da Computação RESUMO: Mensagens tóxicas tornaram-se um problema significativo em plataformas de mídia social,
pois são usadas para prejudicar indivíduos, grupos e organizações governamentais.
Embora existam abordagens capazes de lidar com essa linguagem abusiva, a maioria
são desenvolvidas para o inglês devido à grande quantidade de recursos disponíveis.
Recursos linguísticos, como corpora, são essenciais para projetar sistemas eficazes de detecção automática de conteúdo tóxico. No entanto, a dificuldade em treinar adequadamente anotadores e a falta de ferramentas de crowdsourcing para audiências
com expertise em língua portuguesa apresentam um desafio real para a criação de
conjuntos de dados em português. Esta pesquisa define uma abordagem de grafo
heterogêneo para lidar com a detecção de linguagem tóxica. Para realizar essa tarefa, um
corpus de mensagens tóxicas é construído e anotado por duas ferramentas automáticas,
e uma amostra é selecionada para curagem de dados por quatro avaliadores. Esse
corpus curado é usado como conjunto de treinamento para os experimentos, que
demonstraram resultados satisfatórios e reportam nível de concordância moderado. MEMBROS DA BANCA: Presidente - 628.763.923-72 - ANDRE MACEDO SANTANA Externo à Instituição - GUSTAVO PAIVA GUEDES E SILVA - IFRJ Externo à Instituição - RAIMUNDO SANTOS MOURA - UFPI Interno - 751.764.243-04 - VINICIUS PONTE MACHADO