Publication
Aprendizagem Computacional aplicada à Deteção de Intrusões - Efeito das Técnicas de Balanceamento de Dados
datacite.subject.fos | Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática | pt_PT |
dc.contributor.advisor | Grilo, Carlos Fernando de Almeida | |
dc.contributor.author | Almeida, Hugo Pedro Bessa | |
dc.date.accessioned | 2022-05-16T09:29:48Z | |
dc.date.available | 2022-05-16T09:29:48Z | |
dc.date.issued | 2021-12-16 | |
dc.description.abstract | A cibersegurança tem vindo a ganhar cada vez mais importância. Atualmente, as redes computacionais profissionais e domésticas estão expostas a um grande número de ataques maliciosos. Todo este crescimento e evolução torna cada vez mais complexa e pertinente a deteção e prevenção destas ameaças. Umas das áreas que tem sido preponderante nesta tarefa é a aprendizagem computacional. No entanto, grande parte dos trabalhos existentes nesta área concentra-se na realização de experiências com novos algoritmos de classificação, sendo o efeito das operações de limpeza, pré-processamento e balanceamento dos dados relegados para segundo plano. Isto é particularmente importante visto que, um dos problemas comuns em conjuntos de dados reais e, em particular, nos conjuntos de dados de tráfego de rede, é a falta de balanceamento dos dados. O objetivo deste trabalho consiste em estudar os efeitos de duas técnicas de balanceamento dos dados opostas no processo da aprendizagem computacional, a saber, o Random UnderSampling e o Random OverSampling. Para tal, foi escolhido o conjunto de dados CSE-CIC-IDS-2018, cujo conteúdo tende a simular o tráfego passível de ser encontrado numa rede computacional empresarial. Para atingir o objetivo proposto foram aplicadas várias técnicas de limpeza e de pré-processamento, foram também criadas várias versões de conjuntos de dados para treino, aplicados métodos de seleção de atributos e algoritmos de classificação. Os resultados dos testes realizados permitem formular as seguintes conclusões: 1) existe um melhoramento dos resultados até um determinado nível de undersampling mas, para além desse limite, a redução da quantidade de dados leva a uma deterioração dos resultados; 2) o efeito do operador de oversampling Random OverSampling é muito pouco significativo; 3) estas conclusões mantêm-se quando se utilizam conjuntos de dados sobre os quais foram realizadas operações de seleção de atributos. | pt_PT |
dc.identifier.tid | 203010299 | pt_PT |
dc.identifier.uri | http://hdl.handle.net/10400.8/7136 | |
dc.language.iso | por | pt_PT |
dc.subject | Cibersegurança | pt_PT |
dc.subject | Intrusion Detection Systems | pt_PT |
dc.subject | Aprendizagem computacional | pt_PT |
dc.subject | Balanceamento de dados | pt_PT |
dc.subject | Pré-processamento | pt_PT |
dc.subject | Seleção de atributos | pt_PT |
dc.title | Aprendizagem Computacional aplicada à Deteção de Intrusões - Efeito das Técnicas de Balanceamento de Dados | pt_PT |
dc.type | master thesis | |
dspace.entity.type | Publication | |
rcaap.rights | openAccess | pt_PT |
rcaap.type | masterThesis | pt_PT |
thesis.degree.name | Mestrado em Cibersegurança e Informática Forense | pt_PT |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Dissertacao_HugoAlmeida_com_correções_formais.pdf
- Size:
- 2.94 MB
- Format:
- Adobe Portable Document Format
- Description: