Banca de TCC – Mikael Poetsch
UNIVERSIDADE FEDERAL DE PELOTAS
CENTRO DE DESENVOLVIMENTO TECNOLÓGICO
TRABALHO DE CONCLUSÃO DE CURSO
Apresentações Finais (2018/2)
DERIS-B: Decentralized Recoverable Identification System Based on Blockchain. Um Conjunto de Protocolos para Identificação de Pessoas via Blockchain
por
Mikale Poetsch
Curso:
Ciência da Computação
Banca:
Prof. Larissa A. de Freitas (orientador(a))
Prof. Tiago Primo
Prof. Evandro Fonseca
Data: 23 de novembro de 2018
Hora: 9:00
Local: Sala 413
Resumo do Trabalho:
Word Embedding é uma classe de técnicas onde palavras ou frases do
vocabulário são representadas como vetores de números reais em um espaço vetorial pré-definido. Essa abordagem pode auxiliar nas tarefas de processamento de linguagem natural, como classificação de textos, agrupamento de textos, marcação de parte da fala, reconhecimento de entidades nomeadas, análise de sentimento e outras.
Neste trabalho iremos criar diferentes modelos de Word Embedding utilizando comentários de hotéis postados no site TripAdvisor. Os comentários serão pré- processados a fim de reduzir ruídos e então os tokens serão submetidos aos 4 principais algoritmos de Word Embedding presentes na literatura, são eles: Word2Vec, GloVe, Wang2Vec e FastText. Os tokens podem ser criados de diferentes formas com diferentes dimensões, a fim de prever o significado sintático ou semântico de uma palavra. Ao final, os gráficos dos modelos criados são comparados com uma ontologia do setor hoteleiro com o objetivo de enriquecê-la, ou seja, adicionar novos conceitos e/ou relações na ontologia de domínio.