Lopes, António Manuel Rodrigues2015-03-182015-03-182013http://hdl.handle.net/10400.8/1321Dissertação apresentado à Escola Superior de Tecnologia e Gestão do IPL para obtenção do grau de Mestre em Engenharia Informática - Computação Móvel, orientada pelo Doutor Vítor Manuel Basto Fernandes.O presente trabalho foi realizado no Centro Interdisciplinar de Documentação Linguística e Social, no âmbito do projeto “Framework to edit and use data from fieldwork in linguistic research”, que é um dos sub-projetos pertencentes ao CLARIN (Common Language Resource and Technology Infrastructure) dentro do 7º Programa Quadro da UE (FP7). O objetivo do projeto consiste na construção de uma ponte entre os formatos de dados e ficheiros usados na documentação de línguas – especialmente ELAN-Annotation-Format – e os formatos de dados usados em corpus linguísticos e em Processamento de Linguagem Natural, NLP (Natural Language Processing), que hoje são armazenados em arquivos de línguas como o The Language Archive no Instituto Max Planck, situado em Nijmegen, Holanda. O projeto consiste no desenvolvimento de uma biblioteca que transforme os formatos de dados e ficheiros numa estrutura de dados unificados, seguindo uma implementação da ISO 24612 LAF (Linguistic Annotation Framework).porLinguistic Annotation FrameworkProcessamento de linguagemCorpus linguísticoFramework to edit and use data from fieldwork in linguistic researchmaster thesis201879840