Logo do repositório
 
A carregar...
Miniatura
Publicação

Deep Learning para Reconhecimento de Voz em Aplicações Médicas (Deepvoice)

Utilize este identificador para referenciar este registo.

Resumo(s)

Esta dissertação teve como objetivo trabalhar na melhoria e acessibilidade de uma aplicação médica desenvolvida o ano passado, recorrendo ao uso de redes neuronais em Deep Learning. A aplicação final tem como objetivo, permitir o controlo por voz da aplicação de diagnóstico de Covid-19, controlando o rato com recurso a comandos de voz. Dessa forma, foi inicialmente efetuado um estudo de diversas formas, algoritmos e estruturas das Redes Neuronais em Deep Learning de forma a apurar qual das diversas opções seria mais viável, precisa e rápida. Após isso, foi implementado um sistema de reconhecimento de voz utilizando um método inovador baseado em espectrogramas de Mel que posteriormente são analisados pela rede neuronal de forma a ser efetuado o treino do modelo usado pela aplicação. O uso de técnicas de Deep Learning e a abordagem inovadora com espectrogramas proporcionaram resultados muito bons e que encaminham esta metodologia para posterior investigação, possivelmente com datasets que incluam um maior número de amostras com mais oradores.

Descrição

Palavras-chave

Deep Learning CNN EfficientNet Resnet50 Espetrogramas

Contexto Educativo

Citação

Projetos de investigação

Unidades organizacionais

Fascículo