Publication
CLASSIFICAÇÃO DE CENAS ACÚSTICAS EM DISPOSITIVOS COM CONSTRANGIMENTOS COMPUTACIONAIS UTILIZANDO INTELIGÊNCIA ARTIFICIAL
datacite.subject.fos | Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática | pt_PT |
dc.contributor.advisor | Bento, Luís Manuel Conde | |
dc.contributor.author | Anastácio, Ricardo Ribeiro | |
dc.date.accessioned | 2023-03-29T15:41:14Z | |
dc.date.available | 2023-03-29T15:41:14Z | |
dc.date.issued | 2022-12-12 | |
dc.description.abstract | Ao longo desta dissertação é apresentada a pesquisa e desenvolvimento de um modelo neuronal de arquitetura Convolutional Neural Network (CNN) para classificar dez ambientes acústicos distintos, destinado a dispositivos baixa complexidade, i.e. limite 128K em número de parâmetros e máximo de 30 MMAC (milhões de Multiply- ACcumulate (MAC)) por inferência. É utilizada a pesquisa de hiperparâmetros (hypertuning), para conseguir retirar o máximo de informação pertinente dos recursos de áudio e também para otimizar a arquitetura do modelo. São utilizadas técnicas de aumento de dados, suavização de rótulos e paragem de treino antecipada para melhorar a generalização do modelo, melhorando a resposta na presença de novos dados não utilizados para treino. São propostas ainda três abordagens com o objetivo de aumentar o campo de aprendizagem e melhorar a diferenciação entre classes. Estas abordagens combinam métodos de otimização e aprendizagem, como agrupamento de modelos ensemble, separação de classes ou aprendizagem um contra todos (OvA). Foi ainda aplicada a técnica de destilação de conhecimento (KD), que permitiu reduzir a sua complexidade do modelo, esta técnica acabou por funcionar também como regularizador diminuindo o sobreajuste. As abordagens propostas foram validadas através da participação no desafio “Task 1, Low-Complexity Acoustic Scene Classification 2022” proposto pela comunidade internacional DCASE, conseguindo obter o 4.º lugar na classificação de equipas num universo de 19 equipas, e 11.º lugar perante 48 modelos em avaliação. O modelo submetido que obteve melhores resultados é designado AI4EDGE_4 é um ensemble de dez modelos OvA, utilizado como “professor” num processo de destilação de conhecimento num “aluno” de arquitetura TBM2. O modelo base fornecido em DCASE obteve uma exatidão de ACC=44.2% e uma perda de LOSS=1.532, o modelo AI4EDGE_4 obteve melhor desempenho i.e. uma exatidão de AC=51.6% e uma perda de LOSS=1.330. | pt_PT |
dc.identifier.tid | 203263200 | pt_PT |
dc.identifier.uri | http://hdl.handle.net/10400.8/8299 | |
dc.language.iso | por | pt_PT |
dc.subject | Rede neuronal artificial | pt_PT |
dc.subject | Classificação de cenas acústicas | pt_PT |
dc.subject | Dispositivos de ponta | pt_PT |
dc.subject | Rede neuronal convolucional | pt_PT |
dc.subject | Pesquisa de hiperparâmetros | pt_PT |
dc.subject | Redes neuronais conjuntas (ensemble) | pt_PT |
dc.title | CLASSIFICAÇÃO DE CENAS ACÚSTICAS EM DISPOSITIVOS COM CONSTRANGIMENTOS COMPUTACIONAIS UTILIZANDO INTELIGÊNCIA ARTIFICIAL | pt_PT |
dc.type | master thesis | |
dspace.entity.type | Publication | |
rcaap.rights | openAccess | pt_PT |
rcaap.type | masterThesis | pt_PT |
thesis.degree.name | Mestrado em Engenharia Electrotécnica | pt_PT |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- AI4EDGE_MCU_THESIS_20220726_com_correções_finais.pdf
- Size:
- 9.98 MB
- Format:
- Adobe Portable Document Format
- Description:
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.32 KB
- Format:
- Item-specific license agreed upon to submission
- Description: