Defesa de Dissertação – Emanuel Queiroga
Título: Geração de Modelos de Predição para Estudantes em Risco de Evasão em Cursos Técnicos a Distância Utilizando Técnicas de Mineração de Dados
Autor: EMANUEL MARQUES QUEIROGA
Orientação:
- Cristian Cechinel, Orientador (PPGC-UFPel)
- Ricardo Araújo, Co-orientador (PPGC-UFPel)
Banca Examinadora:
- Marilton Sanchotene de Aguiar (PPGC-UFPel)
- Paulo R. Ferreira Jr. (PPGC-UFPel)
- Sandro Camargo (Unipampa)
Data: 12 de Junho de 2017
Hora: 10:00
Local: Auditório Acadêmico
Resumo:
A Educação a Distância (EAD) apresenta uma alternativa para o acesso aos programas de qualificação profissional. Entretanto, junto com a utilização da EAD surgiram problemas como os altos percentuais de evasão. Nessa modalidade de educação, a interação entre estudantes e professores geralmente é mediada por um Ambiente Virtual de Aprendizagem (AVA), onde ficam registradas em seus logs de interações todas as ações realizadas pelos estudantes e professores durante o processo de ensino-aprendizagem. O grande volume de dados gerados por essas interações permite a utilização de técnicas de mineração para analisar os dados dos estudantes. Este trabalho aplica técnicas de mineração de dados e aprendizagem de máquina em logs das interações dos estudantes de cursos técnicos a distância dentro dos AVAs com o objetivo de identificar estudantes em situação de risco de evasão, utilizando como variável principal de entrada para os modelos de predição apenas a contagem dessas interações e atributos variados das mesmas. Foram utilizados dados de logs no AVA (contagens de interações e situação final dos estudantes) de quatro cursos técnicos EAD. As interações dos estudantes foram contabilizadas separadamente da seguinte forma: quantidade de interações diária, soma das interações semanais, média semanal das interações, desvio padrão e situação final. Foram avaliados dois cenários diferentes, sendo eles: 1) Geração de modelos de predição com treinamento e teste utilizando dados do próprio curso e a partir de validação cruzada e 2) Treinamento dos modelos com dados de três cursos e teste dos modelos com dados do curso restante. No primeiro cenário foram obtidos modelos de predição da evasão com ACG de até 84% antes da décima semana de curso, alcançado 95% até a semana 52. No segundo a maioria dos modelos de predição apresentam resultados de até 80% nas primeiras dez semanas de curso alcançando 98% antes da metade do curso. Um dos modelos (Random Forest) alcançou uma ACG de até 95% desde as primeiras semanas. Na comparação direta com o modelo estatı́stico ambas a técnicas apresentaram resultados próximos nas primeiras semanas. Entretanto, a partir da décima semana os modelos gerados por meio de mineração de dados apresentaram um crescimento significativo nas ACG enquanto que o modelo estatı́stico se manteve estável. Assim a contribuição deste trabalho é a geração de modelos de predição que possam auxiliar no combate a evasão.