Name: | Description: | Size: | Format: | |
---|---|---|---|---|
1.48 MB | Adobe PDF |
Authors
Abstract(s)
A Geração Aumentada por Recuperação (RAG) é uma estrutura que permite aos
Modelos de Linguagem de Grande Escala (LLMs) melhorar a precisão e a relevância
de respostas dos modelos, através de integração de bases de conhecimento externas.
Neste trabalho, apresenta-se a implementação de um sistema RAG integrado
com LLMs e bases de dados vetoriais (VecDBS) de forma a otimizar a utilização
de Inteligência Artificial Generativa em áreas complexas do ponto de vista de
conhecimento técnico, como a certificação energética em Portugal.
Realizou-se extração de conhecimento através do manual SCE da ADENE, entidade
reguladora, e construiu-se a estratégia do sistema RAG integrado com LLMs,
implementado o modelo Gemma 7B e a base de dados vetorial ChromaDB, dando
acesso aos profissionais da área de terem informações relativamente a processos,
cálculos e elementos legislativos, de forma muito mais eficiente, eliminando o tempo
de pesquisa associada a este processo de certificação.
Avaliou-se o projeto através de uma análise comparativa entre o sistema RAG
e os métodos tradicionais, focando na precisão, relevância e clareza das respostas
geradas. As metodologias de avaliação empíricas demonstram que o sistema melhora
significativamente as capacidades de resposta a este tema complexo, dando mais
clareza, integridade e relevância na informação gerada e aumentando a eficiência
dos profissionais da área.
Simultaneamente, os resultados demonstraram ainda uma redução de 92,5% nos
custos para preparação e utilização do sistema, em comparação com as abordagens de
fine-tuning tradicionais, e uma melhoria consistente na precisão e relevância das respostas,
reduzindo ainda os custos associados, sendo eles financeiros, computacionais
e temporais.
Description
Keywords
Geração aumentada por recuperação Modelo de linguagem de grande escala Inteligência artificial generativa Bases de dados vetoriais