Name: | Description: | Size: | Format: | |
---|---|---|---|---|
7.91 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
Esta dissertação teve como objetivo criar um modelo capaz de classificar fonemas
em português, utilizando técnicas avançadas de Deep Learning. Um fonema é a
menor unidade de som na linguagem, e a sua correta identificação é essencial para
a compreensão da fala. Ao focar na classificação de fonemas, em vez de palavras
inteiras, este projeto busca superar desafios relacionados a variações de sotaques ou
deficiências na fala, permitindo um reconhecimento mais preciso e inclusivo. Foram
exploradas várias técnicas de Deep Learning, que foram aplicadas na análise de
Mel-Espectrogramas — representações visuais das frequências dos sons ao longo
do tempo. Esses espectrogramas serviram como base para o treino do modelo,
permitindo que ele classificasse fonemas com boa precisão em testes de validação.
No entanto, o desempenho do modelo foi inferior ao esperado quando testado em
novos dados e amostras de áudio, destacando a necessidade de melhorias na sua
robustez e capacidade de generalização para diferentes contextos linguísticos.
Description
Keywords
Deep Learning Fonemas Mel-Espectrogramas Reconhecimento de fala