Repository logo
 
Loading...
Thumbnail Image
Publication

DEEP LEARNING PARA RECONHECIMENTO DE FONEMAS CONCATENADOS

Use this identifier to reference this record.
Name:Description:Size:Format: 
Dissertacao_Pedro_Costa_2223244_Final.pdf7.91 MBAdobe PDF Download

Abstract(s)

Esta dissertação teve como objetivo criar um modelo capaz de classificar fonemas em português, utilizando técnicas avançadas de Deep Learning. Um fonema é a menor unidade de som na linguagem, e a sua correta identificação é essencial para a compreensão da fala. Ao focar na classificação de fonemas, em vez de palavras inteiras, este projeto busca superar desafios relacionados a variações de sotaques ou deficiências na fala, permitindo um reconhecimento mais preciso e inclusivo. Foram exploradas várias técnicas de Deep Learning, que foram aplicadas na análise de Mel-Espectrogramas — representações visuais das frequências dos sons ao longo do tempo. Esses espectrogramas serviram como base para o treino do modelo, permitindo que ele classificasse fonemas com boa precisão em testes de validação. No entanto, o desempenho do modelo foi inferior ao esperado quando testado em novos dados e amostras de áudio, destacando a necessidade de melhorias na sua robustez e capacidade de generalização para diferentes contextos linguísticos.

Description

Keywords

Deep Learning Fonemas Mel-Espectrogramas Reconhecimento de fala

Citation

Research Projects

Organizational Units

Journal Issue

Publisher

CC License