Ir para acessibilidade
inicio do conteúdo

Banca de QUALIFICAÇÃO: FRANCISCO ASSIS RICARTE NETO

2024-04-20 12:31:12.176

Uma banca de QUALIFICAÇÃO de DOUTORADO foi cadastrada pelo programa.
DISCENTE: FRANCISCO ASSIS RICARTE NETO
DATA: 17/05/2024
HORA: 08:30
LOCAL: Sala virtual
TÍTULO: Método baseado em Grafo Hetergêneo para construção de dataset de linguagem tóxica
PALAVRAS-CHAVES: Linguagem tóxica, Detecção de linguagem tóxica, Corpus, Grafo heterogêneo.
PÁGINAS: 43
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
RESUMO: Mensagens tóxicas tornaram-se um problema significativo em plataformas de mídia social, pois são usadas para prejudicar indivíduos, grupos e organizações governamentais. Embora existam abordagens capazes de lidar com essa linguagem abusiva, a maioria são desenvolvidas para o inglês devido à grande quantidade de recursos disponíveis. Recursos linguísticos, como corpora, são essenciais para projetar sistemas eficazes de detecção automática de conteúdo tóxico. No entanto, a dificuldade em treinar adequadamente anotadores e a falta de ferramentas de crowdsourcing para audiências com expertise em língua portuguesa apresentam um desafio real para a criação de conjuntos de dados em português. Esta pesquisa define uma abordagem de grafo heterogêneo para lidar com a detecção de linguagem tóxica. Para realizar essa tarefa, um corpus de mensagens tóxicas é construído e anotado por duas ferramentas automáticas, e uma amostra é selecionada para curagem de dados por quatro avaliadores. Esse corpus curado é usado como conjunto de treinamento para os experimentos, que demonstraram resultados satisfatórios e reportam nível de concordância moderado.
MEMBROS DA BANCA:
Presidente - 628.763.923-72 - ANDRE MACEDO SANTANA
Externo à Instituição - GUSTAVO PAIVA GUEDES E SILVA - IFRJ
Externo à Instituição - RAIMUNDO SANTOS MOURA - UFPI
Interno - 751.764.243-04 - VINICIUS PONTE MACHADO

fim do conteúdo