???iracessibilidade???
???inicioConteudo???

Banca de DEFESA: BIANCA VALERIA LOPES PEREIRA

2024-05-23 17:58:04.108

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: BIANCA VALERIA LOPES PEREIRA
DATA: 06/06/2024
HORA: 09:00
LOCAL: Online - google meet
TÍTULO: Reconhecimento de fonemas com compactação das frequências via centroide e redes stacked autoencoders
PALAVRAS-CHAVES: Reconhecimento de fonemas. Coeficientes de compactação. Stacked autoencoders.
PÁGINAS: 117
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
RESUMO: O reconhecimento de fonemas é uma área da linguística e processamento de fala que envolve identificar e distinguir os sons distintivos que compõem uma língua. Reconhecer fonemas envolve a capacidade de discernir e categorizar os diferentes sons da fala, mesmo quando há variações de pronúncia, contexto ou entonação. Neste trabalho, é proposto um modelo de reconhecimento de fonemas utilizando uma rede stacked autoencoder, denominada CollabNet. A CollabNet introduz um método colaborativo para inserção de novas camadas escondidas, em contraste com o tradicional empilhamento de autoencoders. Na CollabNet, a adição de uma nova camada é feita de forma coordenada e gradual, permitindo ao projetista controlar sua influência no treinamento. Essa colaboração garante que o aprendizado da nova camada se integre de forma eficaz com as camadas anteriores, resultando em um treinamento mais alinhado e eficiente. Para a representação dos fonemas, foi realizada a compactação das frequências por meio de centroides, de maneira que se preserve as particularidades do som. Com o objetivo de criar uma representação geométrica dos áudios das bases de dados, foi calculada a transformada rápida de Fourier (FFT) para cada amostra de áudio, em seguida foram agrupadas as frequências e foi calculado o centroide de cada grupo. Posteriormente, a rede deep stacked autoencoder foi parametrizada e treinada para o reconhecimento de sílabas fonemas. Com essa representação dos áudios, foi possível manter sua caracterização particular de maneira que a CollabNet identificasse os diversos sons da língua portuguesa do Brasil, tendo assim uma acurácia de 75,96% e PER de 23,73%.
MEMBROS DA BANCA:
Interno - 1091306 - ALEXANDRE CESAR MUNIZ DE OLIVEIRA
Presidente - 2044484 - AREOLINO DE ALMEIDA NETO
Externo à Instituição - NELSON CRUZ SAMPAIO NETO - UFPA

???fimConteudo???