Publication
APLICAÇÃO DE RAG EM MODELOS LLM COM BASES DE DADOS VETORIAIS
datacite.subject.fos | Engenharia e Tecnologia::Outras Engenharias e Tecnologias | pt_PT |
dc.contributor.advisor | Malheiro, Ricardo Manuel da Silva | |
dc.contributor.advisor | Piedade, Maria Beatriz Guerra da | |
dc.contributor.author | Marques, Ruben Alexandre Dias | |
dc.date.accessioned | 2024-12-17T13:41:36Z | |
dc.date.available | 2024-12-17T13:41:36Z | |
dc.date.issued | 2024-11-21 | |
dc.description.abstract | A Geração Aumentada por Recuperação (RAG) é uma estrutura que permite aos Modelos de Linguagem de Grande Escala (LLMs) melhorar a precisão e a relevância de respostas dos modelos, através de integração de bases de conhecimento externas. Neste trabalho, apresenta-se a implementação de um sistema RAG integrado com LLMs e bases de dados vetoriais (VecDBS) de forma a otimizar a utilização de Inteligência Artificial Generativa em áreas complexas do ponto de vista de conhecimento técnico, como a certificação energética em Portugal. Realizou-se extração de conhecimento através do manual SCE da ADENE, entidade reguladora, e construiu-se a estratégia do sistema RAG integrado com LLMs, implementado o modelo Gemma 7B e a base de dados vetorial ChromaDB, dando acesso aos profissionais da área de terem informações relativamente a processos, cálculos e elementos legislativos, de forma muito mais eficiente, eliminando o tempo de pesquisa associada a este processo de certificação. Avaliou-se o projeto através de uma análise comparativa entre o sistema RAG e os métodos tradicionais, focando na precisão, relevância e clareza das respostas geradas. As metodologias de avaliação empíricas demonstram que o sistema melhora significativamente as capacidades de resposta a este tema complexo, dando mais clareza, integridade e relevância na informação gerada e aumentando a eficiência dos profissionais da área. Simultaneamente, os resultados demonstraram ainda uma redução de 92,5% nos custos para preparação e utilização do sistema, em comparação com as abordagens de fine-tuning tradicionais, e uma melhoria consistente na precisão e relevância das respostas, reduzindo ainda os custos associados, sendo eles financeiros, computacionais e temporais. | pt_PT |
dc.identifier.tid | 203760280 | pt_PT |
dc.identifier.uri | http://hdl.handle.net/10400.8/10311 | |
dc.language.iso | por | pt_PT |
dc.subject | Geração aumentada por recuperação | pt_PT |
dc.subject | Modelo de linguagem de grande escala | pt_PT |
dc.subject | Inteligência artificial generativa | pt_PT |
dc.subject | Bases de dados vetoriais | pt_PT |
dc.title | APLICAÇÃO DE RAG EM MODELOS LLM COM BASES DE DADOS VETORIAIS | pt_PT |
dc.type | master thesis | |
dspace.entity.type | Publication | |
rcaap.rights | openAccess | pt_PT |
rcaap.type | masterThesis | pt_PT |
thesis.degree.name | Mestrado em Ciência de Dados | pt_PT |