Banca de TCC – Larissa de Ávila Araújo
UNIVERSIDADE FEDERAL DE PELOTAS
CENTRO DE DESENVOLVIMENTO TECNOLÓGICO
TRABALHO DE CONCLUSÃO DE CURSO
Apresentações Finais (2018/2)
Uma Comparação e Adaptação de Métodos de Análise de Sentimentos para Textos sobre Política em Português e Inglês
por
Larissa de Ávila Araújo
Curso:
Ciência da Computação
Banca:
Prof. Ricardo Matsumura Araujo (orientador(a))
Profa. Larissa Astrogildo de Freitas (coorientador(a))
Prof. Tiago Thompsen Primo
Prof. Ulisses Brisolara Corrêa
Data: 07 de dezembro de 2018
Hora: 13:30
Local: Sala 415
Resumo do Trabalho:
A análise de sentimento surgiu da necessidade de compreender as emoções humanas em textos opinativos de forma automatizada. Os sites de redes sociais são excelentes plataformas de extração de opiniões e possuem uma variedade de assuntos, dentre estes, o foco escolhido foi a política. Este trabalho propõe um estudo comparativo das técnicas utilizadas para a modelagem da análise de sentimento com foco no desenvolvimento em aprendizado de máquina, bem como a adaptação dos algoritmos estado-da-arte para o ambiente político nos idiomas inglês e português. Para isto, foram utilizadas duas bases de dados, uma para cada idioma. Para o idioma português foi feita uma coleta de dados do Twitter sobre as eleições presidenciais brasileiras de 2018, já para o idioma inglês foi retirada uma base já rotulada sobre o primeiro debate do partido republicano para as eleições presidenciais estadunidenses de 2016. Posteriormente estes dados foram rotulados, no caso dos dados em português, tratados e classificados de acordo com o sentimento expresso. Para ambas as bases, as classes que indicam o sentimento foram positivo e negativo. É observado que o classificador SVM obteve melhor desempenho para ambos os idiomas, com 83% de acurácia para o idioma inglês e 87% de acurácia para o idioma português enquanto o classificador MNB obteve resultados semelhantes para ambos os idiomas, com 81% e 82% de acurácia para inglês e português, respectivamente.