Name: | Description: | Size: | Format: | |
---|---|---|---|---|
520.95 KB | Adobe PDF |
Authors
Abstract(s)
Face ao grande crescimento que tem ocorrido com a disponibilização e a visualização de
vídeos online, torna-se necessário melhorar o resultado dos milhões de pesquisas
diariamente efetuadas. Para tal terão de se criar ferramentas que auxiliem no processo de
identificação automática dos conteúdos dos vídeos. Atualmente para efetuar essa
identificação terá de se consultar a informação introduzida manualmente (título e/ou
palavras-chave) ou visualizar o seu conteúdo.
No âmbito do estágio de natureza profissional foi desenvolvido um protótipo para o
reconhecimento de objetos em vídeos, e para a extração automática dos metadados
correspondentes à classe de objetos detetados. O reconhecimento de objetos é efetuado em
cada uma das frames (imagens) que compõem o vídeo, e inclui a deteção e a classificação
dos objetos.
Na primeira versão do protótipo são utilizados classificadores Haar Cascade, e a API
OpenCV, para efetuar o reconhecimento e classificação de objetos em cada imagem. Foram
detetados alguns problemas com as taxas de acerto no reconhecimento dos objetos, com
exceção das faces humanas, e com o desempenho do protótipo. Os problemas foram
ultrapassados com uma nova versão do protótipo, que utiliza a rede neuronal convolucional
GoogLeNet, suportada pela API Tensorflow e treinada com o dataset ImageNet, para efetuar
o reconhecimento e a classificação dos objetos em imagens.
Description
Keywords
Reconhecimento de objectos Vídeo Classificadores Haar Cascade OpenCV Redes neuronais convolucionais Tensorflow