Banca do PCC: Tiago Schenkel
UNIVERSIDADE FEDERAL DE PELOTAS
CENTRO DE DESENVOLVIMENTO TECNOLÓGICO
CURSO DE CIÊNCIA DA COMPUTAÇÃO
Apresentações do Projeto de Conclusão de Curso (2011/2)
Além dos filtros sociais: aprendizado de máquina aplicado a personalização de fluxos de mensagens no Twitter
por
Tiago Schenkel
Banca:
Prof. Ricardo Matsumura de Araújo (orientador)
Djonatan Buss (co-orientador)
Prof. Paulo Roberto Ferreira Jr
Prof. Marilton Sanchotene de Aguiar
Data: 30 de novembro de 2011
Hora: 16:00h
Local: a definir
Resumo do Trabalho:
Com a popularização do uso das chamadas redes sociais virtuais, muitos tem se utilizado de tais ferramentas para expressar suas opiniões e compartilhar informações, notícias e links com outras pessoas. O Twitter, site de microblogging inserido nesse contexto, permite o compartilhamento de mensagens curtas, de até 140 caracteres, entre os seus usuários. A dinâmica dessa ferramenta baseia-se na criação de vínculos unilaterais entre seus usuários, onde cada usuário escolhe quem deseja seguir, ou seja, de quais contatos deseja receber as atualizações postadas. Na perspectiva do usuário, ele visualiza todas as mensagens de quem está seguindo em sua timeline. O objetivo do presente trabalho é o estudo de técnicas de aprendizado de máquina visando o emprego de algoritmos de classificação supervisionada que possam ser aplicados ao fluxo de mensagens no Twitter, com foco na timeline do usuário, de modo a classificar as mensagens recebidas de acordo com os interesses individuais, baseandose nos conceitos de relevância e de importância de cada um. O recurso de Caixa Prioritária do Gmail e a funcionalidade de Notícias Prioritárias do Facebook são exemplos de aplicações práticas de tais filtros por relevância. No entanto, diferentemente desses serviços, as mensagens postadas no Twitter são mensagens curtas, o que o que limita a quantidade de informações disponíveis. Para testar a hipótese de criação desse filtro, o trabalho foca no estudo dos algoritmos Naïve Bayes e Fisher, que comumente são empregados na tarefa de classificação de texto. Tais algoritmos são testados frente a 3 conjuntos de atributos, sendo que o primeiro considera somente o texto do tweet e os outros dois consideram, além do texto, outras informações sociais. Ao final, compara-se o desempenho dos algoritmos testados para se concluir qual obteve o melhor desempenho. Ainda, verifica-se se os atributos sociais considerados influenciaram no desempenho geral dos algoritmos testados.
Para mais informações acesse: http://inf.ufpel.edu.br/nopcc/doku.php?id=bancas:2011_2