Repository logo
 
Publication

APLICAÇÃO DE RAG EM MODELOS LLM COM BASES DE DADOS VETORIAIS

datacite.subject.fosEngenharia e Tecnologia::Outras Engenharias e Tecnologiaspt_PT
dc.contributor.advisorMalheiro, Ricardo Manuel da Silva
dc.contributor.advisorPiedade, Maria Beatriz Guerra da
dc.contributor.authorMarques, Ruben Alexandre Dias
dc.date.accessioned2024-12-17T13:41:36Z
dc.date.available2024-12-17T13:41:36Z
dc.date.issued2024-11-21
dc.description.abstractA Geração Aumentada por Recuperação (RAG) é uma estrutura que permite aos Modelos de Linguagem de Grande Escala (LLMs) melhorar a precisão e a relevância de respostas dos modelos, através de integração de bases de conhecimento externas. Neste trabalho, apresenta-se a implementação de um sistema RAG integrado com LLMs e bases de dados vetoriais (VecDBS) de forma a otimizar a utilização de Inteligência Artificial Generativa em áreas complexas do ponto de vista de conhecimento técnico, como a certificação energética em Portugal. Realizou-se extração de conhecimento através do manual SCE da ADENE, entidade reguladora, e construiu-se a estratégia do sistema RAG integrado com LLMs, implementado o modelo Gemma 7B e a base de dados vetorial ChromaDB, dando acesso aos profissionais da área de terem informações relativamente a processos, cálculos e elementos legislativos, de forma muito mais eficiente, eliminando o tempo de pesquisa associada a este processo de certificação. Avaliou-se o projeto através de uma análise comparativa entre o sistema RAG e os métodos tradicionais, focando na precisão, relevância e clareza das respostas geradas. As metodologias de avaliação empíricas demonstram que o sistema melhora significativamente as capacidades de resposta a este tema complexo, dando mais clareza, integridade e relevância na informação gerada e aumentando a eficiência dos profissionais da área. Simultaneamente, os resultados demonstraram ainda uma redução de 92,5% nos custos para preparação e utilização do sistema, em comparação com as abordagens de fine-tuning tradicionais, e uma melhoria consistente na precisão e relevância das respostas, reduzindo ainda os custos associados, sendo eles financeiros, computacionais e temporais.pt_PT
dc.identifier.tid203760280pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.8/10311
dc.language.isoporpt_PT
dc.subjectGeração aumentada por recuperaçãopt_PT
dc.subjectModelo de linguagem de grande escalapt_PT
dc.subjectInteligência artificial generativapt_PT
dc.subjectBases de dados vetoriaispt_PT
dc.titleAPLICAÇÃO DE RAG EM MODELOS LLM COM BASES DE DADOS VETORIAISpt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Ciência de Dadospt_PT

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
tese_ruben_dias_marques_vf_cf.pdf
Size:
1.48 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.32 KB
Format:
Item-specific license agreed upon to submission
Description: