Banca de DEFESA: MAURICIO CESAR PINTO PESSOA
2018-08-17 10:50:08.792
Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: MAURICIO CESAR PINTO PESSOA
DATA: 23/08/2018
HORA: 10:00
LOCAL: Auditório do DEINF
TÍTULO: Segmentação de Códigos de Mordida em Áudios com Ambientes Ruidosos
PALAVRAS-CHAVES: Processamento de áudio, remoção de ruídos, segmentação de áudio, redes
geradoras adversárias, wavelets.
PÁGINAS: 82
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
RESUMO: A presença de ruídos aditivos é um dos principais problemas em sistemas de reconhecimento
de áudio digital, pois dificultam a etapa de segmentação dos trechos relevantes de áudio,
além de reduzir o desempenho dos classificadores. O principal objetivo desse trabalho é
desenvolver um método de remoção de ruído e segmentação em arquivos de áudio digital,
com foco nos arquivos gerados pelo método de observação direta, onde um observador
grava em áudio todas as ações executadas pelo espécime observado de forma codificada em
Bite Categories. Esse método pré-processa os arquivos de áudio a fim de normalizá-los e de
reduzir sua dimensionalidade, posteriormente sendo utilizada a rede geradora advers´aria
SEGAN para a remoção dos ruídos. A etapa de segmentação do áudio começa com um
pré-processamento que atenua os vales do sinal e enfatiza os picos, de forma similar à
normalização do sinal, seguido da aplicação de uma função de silenciamento de vales, com
base no desvio padrão e escore padronizado. A segmentação é realizada a partir de uma
função de mapeamento que encontra os tempos de início e fim de cada segmento com base
na detecção de silêncios usando janelas deslizantes com sobreposição. Os testes de remoção
de ruídos foram realizados através de um estudo duplo-cego, utilizando questionários com
escala de Likert unipolar de 5 pontos e uma base de áudios compilada pelo autor, de forma
a medir subjetivamente a qualidade do método, onde se obteve uma média 3,56 de 5 na
remoção de ruídos e média 4,14 de 5 na qualidade geral do áudio. Os testes de segmentação
foram realizados a partir de uma segunda base de áudios compilada pelo autor, onde se
obteve um CSD de 85,10% para os áudios sem ruído, 77,95% para os áudios ruidosos e
76,12% para os áudios com o ruído removido através da SEGAN. Após a apresentação
dos resultados, compara-se o desempenho dos métodos propostos com alguns trabalhos
relacionados presentes na literatura.
MEMBROS DA BANCA:
Externo à Instituição - ANDRÉ LUIS BRANDÃO - UFABC
Interno - 2582240 - GERALDO BRAZ JUNIOR
Presidente - 2074474 - TIAGO BONINI BORCHARTT