Banca de TCC – Arthur Siqueira e Silva
UNIVERSIDADE FEDERAL DE PELOTAS
CENTRO DE DESENVOLVIMENTO TECNOLÓGICO
TRABALHO DE CONCLUSÃO DE CURSO
Apresentações Finais (2019/2)
Collattum: Sistema recomendador de correspondências entre publicações da Plataforma Lattes
por
Arthur Siqueira e Silva
por
Arthur Siqueira e Silva
Curso:
Ciência da Computação
Banca:
Prof. Ricardo Matsumura de Araújo (orientador(a))
Nícolas Oreques de Araujo (coorientador(a))
Profa. Larissa Astrogildo de Freitas
Prof. Ulisses Brisolara Corrêa
Data: 10 de dezembro de 2019
Hora: 13:30
Local: Sala 305 – Campus II UFPel
Resumo do Trabalho:
A Plataforma Lattes atualmente concentra mais de 3,5 milhões de currículos em sua base e é a maior fonte de dados sobre a pesquisa acadêmica brasileira. A flexibilidade do método de cadastro foi um dos fatores responsáveis por popularizar o sistema, mas é também a fonte de problemas que afetam pesquisas e aplicações que usufruem do seu grande acervo. Devido à liberdade dos usuários de enviarem informações que nem sempre são rigidamente verificadas, diversas inconsistências são geradas na base. Um dos tipos de inconsistência mais comum é a duplicação de publicações, que ocorre quando duas ou mais produções registradas com alguns campos de informação diferentes, na verdade, referem-se à mesma obra. Considerando o problema descrito, este trabalho focou em uma nova abordagem para desambiguar produções do Lattes. Para isso, foi desenvolvido um dataset de produções manualmente, o qual foi utilizado para treinar uma rede neural para identificar se duas produções quaisquer, originadas de currículos Lattes, são similares ou não. A principal contribuição deste trabalho foi a criação de um sistema de recomendação de correspondências entre publicações, o qual aplica um modelo de aprendizado de máquina que obteve 94% de acurácia nos testes realizados para analisar as produções de um pesquisador e de seus coautores registrados no Lattes, permitindo a interação de usuário com a aplicação desenvolvida através de uma interface web.