UNIVERSIDADE ESTADUAL PAULISTA RODRIGO YOSHIO TAMAE TÉCNICAS DE MINERAÇÃO DE DADOS EM EDUCAÇÃO HÍBRIDA DESENVOLVIDA SEGUNDO A ABORDAGEM CCS Presidente Prudente - SP 2018 RODRIGO YOSHIO TAMAE TÉCNICAS DE MINERAÇÃO DE DADOS EM EDUCAÇÃO HÍBRIDA DESENVOLVIDA SEGUNDO A ABORDAGEM CCS Tese de Doutorado apresentada ao Programa de Pós-Graduação em Educação da Faculdade de Ciências e Tecnologia, UNESP/Campus de Presidente Prudente, como exigência parcial para obtenção do título de Doutor em Educação. Orientador: Dr. Klaus Schlünzen Junior Presidente Prudente - SP 2018 Ficha catalográfica elaborada pela Seção Técnica de Aquisição e Tratamento da Informação - Diretoria Técnica de Biblioteca e Documentação - UNESP, Campus de Presidente Prudente Tamae, Rodrigo Yoshio. T154t Técnicas de Mineração de Dados em Educação Híbrida desenvolvida segundo a abordagem CCS / Rodrigo Yoshio Tamae. - 2018 310 f. : il. Orientador: Klaus Schlünzen Junior Tese (doutorado) - Universidade Estadual Paulista. Faculdade de Ciências e Tecnologia, Presidente Prudente, 2018 Inclui bibliografia 1. Mineração de dados educacionais. 2. Abordagem Construcionista, Contextualizada e Significativa. 3. Ambiente Virtual de Aprendizagem. 4. Educação Híbrida. 5.Educação a Distância. I. Schlünzen Junior, Klaus. II. Universidade Estadual Paulista. Faculdade de Ciências e Tecnologia. III. Título. Alessandra Kuba Oshiro Assunção CRB-8/9013 DEDICATÓRIA Ao Senhor Deus, Todo Poderoso "Mas aquele que considera, atentamente, na lei perfeita,lei da liberdade, e nela persevera,não sendo ouvinte negligente, mas operoso praticante, esse será bem aventurado no que realizar." - Tiago 1:25 Aos meus pais, Yoshio (In Memorian) e Lídia "Honra teu pai e tua mãe, a fim de que tenhas vida longa na terra que o Senhor,o teu Deus, te dá." - Êxodo 20:12 A Érika, ao Eduardo e a Vitória "Vede que grande o amor nos tem concecido o Pai, a ponto de sermos chamados filhos de Deus; e, de fato, somos filhos de Deus. Por essa razão, o mundo não nos conhece, porquanto não o conheceu a ele mesmo. Amados, agora, somos filhos de Deus, e ainda não se manifestou o que havemos de ser. Sabemos que, quando ele se manifestar, seremos semelhantes a ele, porque haveremos de vê-lo como ele é." - I João 3:1-2 AGRADECIMENTOS "Quem tem um amigo, mesmo que um só, não importa onde se encontre, jamais sofrerá de solidão; poderá morrer de saudades, mas não estará só." -Amyr Klink Ao meu orientador, Dr. Klaus Schlünzen Junior. Não há palavras para expressar minha gratidão. É a melhor referência que se pode ter de inteligência e de competência, dotado de uma habilidade natural única de empoderar as pessoas para que exercitem e desenvolvam suas capacidades criativas. Um grande exemplo de generosidade, cordialidade e espírito cristão. Professor, você é o responsável pela concretização de um grande sonho e por me ajudar a chegar onde nunca imaginei. A Dra. Elisa Tomoe Moriya Schlünzen, pois quando a conheci "havia uma porta para a qual eu não encontrara nenhuma chave; havia um véu através do qual eu não podia ver" (Omar Khayyan). Você é uma pessoa encantadoramente humilde, dedicada e que transparece seu grande desejo de ajudar a todos. Obrigado por ter aberto uma porta e me apresentar a abordagem CCS, com a qual irei construir um novo caminho. Ao Professor Dr. Marcos Luiz Mucheroni, da ECA-USP, por ter sido o meu orientador na pesquisa de mestrado, por ter me ajudado a ver o mundo profissional a partir de uma perspectiva em que não há separação entre teoria e prática. A todos os membros da banca examinadora por terem dedicado um tempo precioso de suas vidas para contribuir com os resultados da minha pesquisa. A Dra. Danielle Aparecida do Nascimento dos Santos que, mesmo sendo tão jovem, possui sólida reputação profissional e é uma referência quanto a abordagem CCS. Seu grande saber só não é maior do que sua generosidade. Sua ajuda foi essencial durante toda a pesquisa. Ao Dr. Seiji Isotani, pois sendo uma grande referência profissional na área de mineração de dados educacionais, aceitou prontamente os convites para compor as bancas de qualificação e defesa. Muito obrigado pelas contribuições. A Dra. Maria Luisa Furlan Costa por ter se disponibilizado a analisar esta pesquisa e pelas importantes contribuições no contexto da EaD para este estudo. É um exemplo de simpatia, sutileza e profissionalismo. Dr. Milton Hirokazu Shimabukuro por sua criteriosa avaliação e valiosas sugestões que me permitiram melhor compreender as relações entre as áreas de exatas e de humanas. Aos suplentes da banca examinadora, Dr. Evandro de Costa Barros, Dr. Edson do Carmo Inforsato e Dra. Anna Augusta Sampaio. Aos Professores das disciplinas cursadas: A Dra. Renata Portela Rinaldi, um pessoa admirável com quem pude começar a aprender a trabalhar de forma colaborativa, a partir de um olhar amplo e criterioso; ao Dr. Mauro Betti por despertar meu interesse em semiótica; ao Dr. Cristiano Amaral Garboggini Di Giorgi por apresentar a alma encantadora do trabalho de Paulo Freire; a Dra. Arilda Inês Miranda Ribeiro por mostrar que aulas expositivas não são, obrigatoriamente, enfadonhas; e a Dra. Neusa Maria Dal Ri por estimular o rigor das normas técnicas e a excelência científica. A amiga Raquel Pozzenato Silazaki, minha parceira de luta em várias disciplinas e com quem compartilhei momentos enriquecedores. A amiga Lívia Raposo Bardy Ribeiro Prado por ser um grande exemplo de companheirismo, seriedade, superação e dedicação. A amiga Olga Lyda Anglas Rosales Tarumoto pelas lições de simplicidade, humildade e dedicação. Ao amigo Sidinei de Oliveira Sousa por ser um grande exemplo de profissional, de pessoa dedicada, que não mede esforços para compartilhar conhecimentos e lições de vida. A amiga Denise Ivana de Paula Albuquerque pelas conversas e dicas, sempre motivadoras nos intervalos das disciplinas no CPIDES. A amiga Ana Virgínia, por não medir esforços em nos ajudar nas reuniões do grupo de pesquisa. Aos demais colegas e todo pessoal do CPIDES. Há um pouco de vocês em tudo que aprendi. Ao pessoal do Núcleo de Educação a Distância (NEaD) da Unesp por toda a ajuda e suporte no processo de coleta de dados desta pesquisa. Aos funcionários da Secretária de Pós-graduação da Unesp de Presidente Prudente por terem sido sempre tão gentis. Aos meus Amigos fraternos Weber, Francis, Khristóferson, José Elias, Amélia, Eduardo, Ely, Edson e José Júlio, vocês são fonte constante de amparo e inspiração. Vocês são parte deste trabalho. Aos meus colegas de trabalho por todo apoio, torcida e companheirismo. A "dona" Izabel por toda disposição e ajuda sem limites nos momentos cruciais de conclusão deste trabalho. E, por fim, e não menos importante, a toda "Tigrada de MG" por compreenderem que a ausência dos últimos anos se justificou por um objetivo maior, pela realização deste sonho. Muito obrigado! "Não basta ensinar ao homem uma especialidade, porque se tornará assim uma máquina utilizável e não uma personalidade. É necessário que adquira um sentimento, senso prático daquilo que vale a pena ser empreendido, daquilo que é belo, do que é moralmente correto." -Albert Einstein RESUMO Esta pesquisa de doutorado está vinculada ao Programa de Pós-Graduação em Educação da Faculdade de Ciências e Tecnologia da Universidade Estadual Paulista "Júlio de Mesquita Filho" (FCT/Unesp), campus de Presidente Prudente-SP, na linha de pesquisa "Processos Formativos, Ensino e Aprendizagem", nas áreas de Educação a distância (EaD) e Formação de Professores. O grande avanço das Tecnologias Digitais da Informação e da Comunicação (TDIC) tem provocado inúmeras mudanças em todas as áreas da ciência. Na Educação ocorre a ampla adoção e utilização dos Ambientes Virtuais de Aprendizagem (AVA), os quais podem contribuir para a utilização de TDIC, metodologias ativas de aprendizagem e que favorecem a abordagem Construcionista, Contextualizada e Significativa (CCS). A abordagem CCS é aquela em que o cursista utiliza a tecnologia como instrumento para produzir algo que parte da sua vivência e realidade, e ao se deparar com os conceitos curriculares, o professor atua como mediador para ajudá-lo a formalizar esses conceitos. Nesse contexto, a Internet e os dispositivos móveis passaram a ser utilizados em escala crescente, e tem contribuído para a proliferação de grande quantidade de dados em formato digital que, por sua vez, ainda são pouco utilizados para gerar a descoberta de conhecimento em contextos educacionais. É onde destaca-se a área de mineração de dados educacionais (MDE), que consiste no desenvolvimento de métodos e técnicas orientados a explorar tais dados digitais para melhor compreender o comportamento dos cursistas e em quais condições eles aprendem. Assim, "como utilizar técnicas de MDE para identificar indícios da abordagem CCS nos cursos da modalidade híbrida?" é a questão que norteia esta pesquisa de doutorado, pois mesmo professores qualificados para atividades docentes, muitas vezes, não possuem proficiência suficiente quanto ao uso de recursos computacionais, tais como linguagens de programação e ferramentas de banco de dados, e muito menos, quanto ao uso de técnicas de mineração de dados aplicadas à contextos educacionais. A pesquisa fez uso tanto da abordagem quantitativa quanto qualitativa, com base no delineamento metodológico Ex Post Facto ou Pesquisa não-experimental, pois o estudo foi realizado após a conclusão dos fatos. Para responder as questões norteadoras, o curso de Educação Especial na Perspectiva Inclusiva do programa Redefor/Unesp foi analisado a partir das categorias CCS (contexto do cursista, espiral de aprendizagem e ciclo de ações, aprendizagem em rede, papel do professor e formalização de conceitos) definidas com base nas indicações de Schlünzen (2000; 2015), Santos (2015) e Valente (2005). Foi utilizado o modelo de mineração de dados proposto por Fayad, Piatetsky-Shapiro e Smyth (1996) e as fases que consomem maior esforço repetitivo possibilitaram o mapeamento de padrões a serem seguidos, e para minimizar os esforços e maximizar os resultados, foi proposto e implementado um protótipo de software denominado EDMXP (Educational Data Mining eXPeriment) em linguagem de programação Java para o suporte às atividades de seleção, pré-processamento, mineração e análise de dados. As tarefas de mineração de dados utilizadas foram as de agrupamento e classificação representadas pelos algoritmos Simple KMeans, VSM e J48. Os resultados foram compilados em uma linguagem que possibilita aos profissionais de Educação melhor compreenderem os resultados (tabelas e gráficos), além de um quadro de indicadores de desempenho (dashboard). Ao final, foi possível constatar que a MDE pode ser um fator transformador em Educação a partir do momento que possibilita que se tome decisões com base em dados e em fatos, e não apenas de forma intuitiva ou por meio de experiências vivênciadas. Representa, portanto, uma nova forma de fazer e pensar a Educação. Palavras-chave: Mineração de dados educacionais. Abordagem Construcionista, Contextualizada e Significativa. Ambiente Virtual de Aprendizagem. Educação Híbrida. Eduacação a Distância. ABSTRACT This doctoral research is bound to the Graduate Program in Education of the Faculty of Science and Technology of the São Paulo State University "Júlio de Mesquita Filho" (FCT / Unesp), Campus of Presidente Prudente-SP, in the research line "Formative Processes, Teaching and Learning", in the areas of Distance Education (D-Learning) and Teacher Training. The great advance of the Digital Technologies of Information and Communication (DTIC) has caused fullness changes in all areas of science. In Education there is a widespread adoption and use of Virtual Learning Environment (VLE), which can contribute to the use of DTIC, active learning methodologies and favoring the Constructionist, Contextualized and Significative (CCS) approach. The CCS approach is that in which student uses technology as an instrument to produce something that arise in your own experience and reality, and when he came across with curricular concepts, teacher acts as mediator to help him to formalize these concepts. In these context, the Internet and mobile devices started to be used on a growing scale and have contributed to the proliferation of large amounts of data in digital format, which in turn are little used to generate the knowledge discovery in educational contexts. It's where stands out the area of Educational Data Mining (EDM), which consists in the development of methods and techniques designed to exploit such digital data to better understand students behavior's and in what conditions they learn. Thus, "how to use EDM techniques to identify evidence of CCS approach in hybrid mode courses?" it's the issue that guides this doctoral research, because even qualified teachers for teaching activities often lack sufficient proficiency in the use of computational resources, such as programming languages and database tools, much less regarding the use of data mining techniques applied to educational contexts. The research made use of both quantitative and qualitative approach, based on the methodological design Ex Post Facto or non-experimental research, once this study was conducted after the completion of the facts. To answer the leading questions, the Special Education course in the Inclusive Perspective of the Redefor / Unesp program was analyzed from the CCS categories (student's context, learning spiral and cycle of actions, learning network, teacher role and concepts formalization) defined according to the indications of Schlünzen (2000; 2015), Santos (2015) and Valente (2005). It was used the data mining model proposed by Fayad, Piatetsky-Shapiro and Smyth (1996) and the phases that consume most repetitive effort allowed the mapping of patterns to be followed, and to minimize efforts and to maximize results, was proposed and implemented a software prototype named EDMXP (Educational Data Mining eXPeriment) in Java programming language to support selection, preprocessing, mining and data analysis activities. The data mining tasks used were clustering and classification tasks represented by the Simple KMeans, VSM and J48 algorithms. The results were compiled in a language that enables Education professionals to better understand results (tables and graphs), as well as a dashboard of performance indicators. Finally, it was possible to verify that EDM can be a transforming factor in Education from the moment that allows decisions based on data and facts, and not only in an intuitive way or by lived experiences. It represents, therefore, a new way of doing and thinking Education. Keywords: Educational Data Mining. Constructionist, Contextualised and Significative Approach. Virtual Learning Environment. Hybrid Education. Distance Education. LISTA DE FIGURAS Figura 1 - Exemplo do conjunto de combinações possíveis ................................................................. 15 Figura 2 - Uma visão geral dos passos que compõem os processos de KDD ....................................... 35 Figura 3 - Áreas que formam a mineração de dados ............................................................................. 36 Figura 4 - Áreas que compõem a mineração de dados educacionais .................................................... 40 Figura 5 - As etapas de pré-processamento no contexto de KDD ......................................................... 44 Figura 6 - Exemplo de Dados para mineração de dados educacionais .................................................. 69 Figura 7 - Exemplo da Interface do Weka Explorer ............................................................................. 71 Figura 8 - Árvore de Decisão gerada a partir dos dados do arquivo .ARFF ......................................... 73 Figura 9 - Equação da Similaridade de Cosseno .................................................................................. 81 Figura 10 - Exemplo da Equação da Similaridade de Cosseno ............................................................. 81 Figura 11 - Exemplo da visualização das classes de atividades ............................................................ 83 Figura 12 - Exemplo do Percurso de Aprendizagem de uma Disciplina............................................... 84 Figura 13 - Grafo de postagens do fórum 1938 (Como estruturar a Gestão Democrática e Participativa) da disciplina 402 (D03-Gestão Democrática e Projeto Pedagógico) .................................................... 88 Figura 14 - Arquitetura funcional da mineração de textos .................................................................... 89 Figura 15 - Modelo de Pacote de Palavras ........................................................................................... 90 Figura 16 - Arquitetura simplificada do protótipo EDMXP ................................................................. 91 Figura 17 – Menu Consultar Recursos ................................................................................................. 92 Figura 18 - Seleção da amostragem de cursistas .................................................................................. 93 Figura 19 - Visão expandida da consolidação dos dados do perfil dos cursistas .................................. 94 Figura 20 - Menu Pré-processamento ................................................................................................... 94 Figura 21 - Consulta ao recurso fórum ................................................................................................. 95 Figura 22 - Preparar análise do fórum .................................................................................................. 95 Figura 23 - Desempenho de postagens no fórum ................................................................................. 96 Figura 24 - Menu Mineração de Dados Educacionais .......................................................................... 96 Figura 25 - Sumarização do arquivo de log do AVA ........................................................................... 98 Figura 26 - Gerar gráfico do comportamento on-line do cursista ........................................................ 98 Figura 27 - Exemplo da visualização das classes de atividades ............................................................ 99 Figura 28 - Recurso de anotação do fórum ......................................................................................... 101 Figura 29 - Detalhe do recurso de anotação das categorias de análise no fórum ................................ 101 Figura 30 - Interface para criar base para aprendizagem de máquina ................................................. 102 Figura 31 – Validação do modelo ...................................................................................................... 103 Figura 32 - Aplicação do modelo de classificação de categorias CCS ............................................... 104 Figura 33 - Tempo on-line do cursista ................................................................................................ 105 Figura 34 - Exemplo de Dashboard (Painel de indicadores) de mensagens do cursista ...................... 107 Figura 35 - Exemplo de Dashboard (Painel de indicadores) sintético do EDMXP ............................. 108 Figura 36 - Nuvem de palavras (Tag cloud) ....................................................................................... 109 Figura 37 - Exemplo de tela de anotação de categorias de análise de conteúdo ................................. 117 Figura 38 - Agrupamento do preenchimento de perfil dos cursistas ................................................... 123 Figura 39 - Nuvem de palavras do Exemplo 1 ................................................................................... 127 Figura 40 - Nuvem de palavras do Exemplo 2 ................................................................................... 129 Figura 41 - Nuvem de palavras do Exemplo 2 ................................................................................... 131 Figura 42 - Visualização das classes de atividades da disciplina D01 ................................................ 135 Figura 43 - Valores médios das classes de ações do curso EEPI ........................................................ 137 Figura 44 - VSM sobre os recursos da disciplina D08 cursista 4045 .................................................. 138 Figura 45 - VSM sobre os recursos da disciplina D08 cursista 7995 .................................................. 139 Figura 46 - Percurso de Aprendizagem da Disciplina 460 (D05-PEI e Ensino colaborativo) ............. 140 Figura 47 - Grafo de postagens do fórum 1187 (Habilidades do cursista da EaD) da disciplina 164 (D00-Introdução a EaD) ..................................................................................................................... 143 Figura 48 - Interface para anotação em postagens do fórum .............................................................. 146 Figura 49 - Visualização e edição de anotação em postagens do fórum a partir do recurso de análise de conteúdo do EDMXP ......................................................................................................................... 146 Figura 50 - Etapas da Espiral de Aprendizagem e do Ciclo de Ações do fórum 1187 da disciplina 164 ........................................................................................................................................................... 147 Figura 51 - Etapas da Espiral de Aprendizagem e do Ciclo de Ações do fórum 1534 da disciplina 259 ........................................................................................................................................................... 148 Figura 52 - Grafo de interações no fórum 2636 (O coensino como modelo de atuação escolar) da disciplina 460 (D05-PEI e Ensino colaborativo) ................................................................................ 156 Figura 53 - Exemplo de Troca de Mensagens entre "Cursistas e Cursistas" ....................................... 161 Figura 54 - Exemplo de Troca de Mensagens entre "Cursistas e TO" ................................................ 162 Figura 55 - Grafo do fórum 1939 (Como estruturar a gestão democrática e participativa) da disciplina 402 (D03-Gestão Democrática e Projeto Pedagógico) ....................................................................... 165 Figura 56 - Exemplo de postagem curta sem indício de fraude .......................................................... 171 Figura 57 - Exemplo de postagens curtas com indício de fraude ........................................................ 171 Figura 58 - Resultado da execução do algoritmo Simple KMeans ..................................................... 173 Figura 59 - Agrupamento gerado a partir do desempenho dos cursistas em função das postagens curtas ........................................................................................................................................................... 175 Figura 60 - Árvore de decisão gerada pelo Algoritmo J48 ................................................................. 178 Figura 61 - Representação gráfica do grafo de interação no fórum 1534 da disciplina 259................ 182 Figura 62- Recorte da Tabela de Probabilidade do cumprimento do ciclo de ações ........................... 186 Figura 63 - Filtragem de troca de mensagens ..................................................................................... 187 LISTA DE LISTAGENS Listagem 1 - Exemplo de um arquivo ARFF ....................................................................................... 48 Listagem 2 - Arquivo .ARFF gerado a partir da Tabela Modelo de Dados para EDM ........................ 70 Listagem 3 - Regras de Decisão gerada a partir do algoritmo J48 ....................................................... 74 Listagem 4 - Regras de Decisão gerada a partir do algoritmo J48 ....................................................... 75 Listagem 5 - Regras de Decisão gerada a partir do algoritmo J48 ....................................................... 76 Listagem 6 - Simulação de erro no uso de Regras de Decisão............................................................. 77 Listagem 7 - Simulação de resultado esperado em Regras de Decisão a partir do algoritmo J48 ........ 77 Listagem 8 - Regras de Classificação gerada a partir do algoritmo JRip ............................................. 79 Listagem 9 - Exemplo de agrupamentos para mineração de dados educacionais ................................ 80 Listagem 10 - Exemplo de vértices e arestas ...................................................................................... 86 Listagem 11 - Arquivo ARFF da base de treinamento para TM ....................................................... 103 Listagem 12 - Representação em formato ARFF do contexto do cursista ........................................ 119 Listagem 13 - Representação em formato ARFF de dados consolidados do perfil ........................... 122 Listagem 14 - Representação em formato ARFF de dados agrupados do perfil ............................... 124 Listagem 15 - Recorte do arquivo .arff de desempenho na troca de mensagens e postagens curtas . 172 Listagem 16 - Saída do processamento do algoritmo J48 ................................................................. 176 Listagem 17 - Regras de classificação do modelo ............................................................................ 177 Listagem 18 - Índice Kappa e Matriz de Confusão gerada pelo algoritmo J48................................. 177 Listagem 19 - Recorte do grafo de interação no fórum 1534 da disciplina 259 ................................ 183 LISTA DE TABELAS Tabela 1 - Etapas de Seleção e Coleta de Dados .................................................................................. 61 Tabela 2 - Subgrupos das Categorias de Análise da Abordagem CCS ................................................. 64 Tabela 3 - Definição de Classes e Tipos de Ação ................................................................................. 97 Tabela 4 - Categorias de informações complementares do perfil do cursista ..................................... 118 Tabela 5 - Dados do perfil básico dos cursistas .................................................................................. 120 Tabela 6 - Frequência dos dados no perfil básico dos cursistas .......................................................... 120 Tabela 7 - Dados complementares do perfil dos cursistas .................................................................. 121 Tabela 8 - Frequência dos dados no perfil reflexivo dos cursistas ...................................................... 121 Tabela 9 - Perfil do cursista associado ao produto final ..................................................................... 122 Tabela 10 - Resumo quantidade de dados do perfil ............................................................................ 124 Tabela 11 - Resumo quantidade de dados do perfil ............................................................................ 125 Tabela 12 - Análise de conteúdo: Contexto (Exemplo 1) - Parte 1 ..................................................... 126 Tabela 13 - Análise de conteúdo: Contexto (Exemplo 2) - Parte 1 ..................................................... 128 Tabela 14 - Análise de conteúdo: Contexto (Exemplo 3) ................................................................... 130 Tabela 15 - Amostra do resultado do algoritmo VSM ........................................................................ 133 Tabela 16 - Amostra da tabela mdl_edm_engaja01 ............................................................................ 141 Tabela 17 - Amostra da tabela mdl_edm_engaja02 ............................................................................ 142 Tabela 18 - Descoberta de Indícios do Ciclo de Ações: Comparação entre o processso manual (A) e o automatizado (B) ................................................................................................................................ 150 Tabela 19 - Probabilidade de cumprimento da espiral de aprendizagem e do ciclo de ações ............. 152 Tabela 20 - Médias das etapas do ciclo de ações ................................................................................ 153 Tabela 21 - Exemplo da Troca de Mensagens entre "Cursistas e Cursistas" e "Professor e Cursistas" ........................................................................................................................................................... 157 Tabela 22 - Agrupamento de Troca de Mensagens entre "Cursistas e Cursistas" e "Professor e Cursistas" ........................................................................................................................................... 162 Tabela 23 - Recorte do agrupamento gerado a partir do algoritmo Simple KMeans .......................... 174 Tabela 24 - Totais de postagens por desempenho .............................................................................. 179 LISTA DE QUADROS Quadro 1 - Identificação do contexto do cursista (categoria C1-Contexto) ........................................ 116 Quadro 2 - Concepção do produto (Relação com a categoria C1-Contexto) ...................................... 116 LISTA DE ABREVIATURAS E SIGLAS AAAI Association for the Advancement of Artificial Intelligence AACD Associação de Assistência à Criança Deficiente ACM Association for Computing Machinery AIED Artificial Intelligence in Education API Ambientes Potencializadores de Inclusão (em Educação) API Application Programming Interface (em Computação) ARFF Attribute-Relation File Format AVA Ambiente Virtual de Aprendizagem CBIS Congresso Brasileiro de Informática na Saúde CCS Construcionista, Contextualizada e Significativa CFSSUBSETEVAL Correlation-based Feature Subset Selection for Machine Learning CPD Centro de Processamento de Dados CSM International Conference on Software Maintenance CSV Comma-Separated Values DEMAC Departamento de Estatística, Matemática Aplicada e Computação DM Data Mining DW Data Warehouse EaD Educação a Distância EDM Educational Data Mining EDM-TF IEEE Task Force of Educational Data Mining EEPI Educação Especial na Perspectiva Inclusiva EJV Estar Junto Virtual EPAEE Estudante Público-Alvo da Educação Especial ER Entity-Relationship / Entidade-Relacionamento ETL Extract, Transform and Load FAEF Faculdade de Agronomia e Engenharia Florestal FAIP Faculdade do Interior Paulista FAPESP Fundação de Amparo à Pesquisa do Estado de São Paulo FAST Feature Aware Student Knowledge Tracing FCT Faculdade de Ciências e Tecnologia FFC Faculdade de Filosofia e Ciências GNU General Public License IA Inteligência Artificial ICMC Instituto de Ciências Matemáticas e de Computação (USP/São Carlos) IEDMS International Educational Data Mining Society IEEE Institute of Electrical and Electronics Engineers IP Internet Protocol ITS Inteligent Tutoring System JEDM Journal of Educational Data Mining JRIP Java RIPPER (Repeated Incremental Pruning to Produce Error Reduction) KDD Knowledge Discovery in Databases LAPTEC International Congress of Logic Applied to Technology MEC Ministério da Educação MOOC Massive Open Online Course MOODLE Modular Object-Oriented Dynamic Learning Environment NEaD Núcleo de Educação a Distância PBL Problem-Based Learning PHP PHP: Hypertext Preprocessor (do original Personal Home Page) PKLG Personal Knowledge/Learning Graph PPGE Programa de Pós-Graduação em Educação REDEFOR Rede São Paulo de Formação Docente RIA Rich Interface Application RIPPER Repeated Incremental Pruning to Produce Error Reduction SBC Sociedade Brasileira de Computação SEE-SP Secretaria da Educação do Estado de São Paulo SoLAR Society for Learning Analytics Research SGBD Sistema Gerenciador de Banco de Dados SQL Structured Query Language TDIC Tecnologias Digitais da Informação e da Comunicação TIC Tecnologias da Informação e Comunicação TM Text Mining TO Tutor On-line UFAL Universidade Federal de Alagoas UFMG Universidade Federal de Minas Gerais UNESP Universidade Estadual Paulista "Júlio de Mesquita Filho" UNIMAR Universidade de Marília UNOESTE Universidade do Oeste Paulista USP Universidade de São Paulo VA Visual Analytic Tool WEKA Waikato Environment for Knowledge Analysis SUMÁRIO APRESENTAÇÃO ................................................................................................................................ 1 CAPÍTULO 1 - INTRODUÇÃO............................................................................................................ 7 1.1 CONSIDERAÇÕES INICIAIS .................................................................................................... 7 1.1.1 Justificativa e Relevância .................................................................................................. 8 1.1.2 Definição do Problema .................................................................................................... 12 1.1.3 Objetivos: Geral e Específicos ......................................................................................... 17 1.1.4 Definição dos termos ....................................................................................................... 17 1.1.5 Indicação da metodologia ................................................................................................ 19 1.1.6 Organização da Tese ........................................................................................................ 19 CAPÍTULO 2 - DELINEAMENTO TEÓRICO DA PESQUISA ........................................................ 21 2.1 ASPECTOS RELEVANTES DO AMBIENTE E ABORDAGEM CCS ................................... 21 2.2 OS ASPECTOS RELEVANTES SOBRE DESCOBERTA DO CONHECIMENTO EM BANCO DE DADOS ....................................................................................................................... 33 2.3 ASPECTOS RELEVANTES SOBRE MINERAÇÃO DE DADOS .......................................... 36 2.4 A MINERAÇÃO DE DADOS EDUCACIONAIS..................................................................... 37 2.5 ASPECTOS HISTÓRICOS RELEVANTES SOBRE MINERAÇÃO DE DADOS EDUCACIONAIS ............................................................................................................................ 41 2.6 FUNCIONAMENTO DA MINERAÇÃO DE DADOS ............................................................. 43 2.7 FERRAMENTAS PARA MINERAÇÃO DE DADOS.............................................................. 46 2.8 TRABALHOS CORRELATOS EM MINERAÇÃO DE DADOS EDUCACIONAIS .............. 48 CAPÍTULO 3 - DELINEAMENTO METODOLÓGICO DA PESQUISA.......................................... 54 3.1 METODOLOGIA DE PESQUISA ............................................................................................ 54 3.2 DEFINIÇÃO DA AMOSTRAGEM DA PESQUISA ................................................................ 56 3.3. PESQUISAS REALIZADAS NO ÂMBITO DO PROGRAMA REDEFOR ............................ 58 3.4 PROCEDIMENTOS DE SELEÇÃO E COLETA DE DADOS ................................................. 60 CAPÍTULO 4 - AS CONTRIBUIÇÕES DA ÁREA DE MINERAÇÃO DE DADOS EDUCACIONAIS PARA O DESENVOLVIMENTO DA ABORDAGEM CCS ............................... 68 4.1 TÉCNICAS DE MINERAÇÃO DE DADOS EDUCACIONAIS APLICADAS A CONTEXTOS DA EDUCAÇÃO HÍBRIDA ................................................................................... 68 4.1.1 Árvore de Decisão ........................................................................................................... 71 4.1.2 Regras de Classificação ................................................................................................... 78 4.1.3 Agrupamento ................................................................................................................... 79 4.1.4 Distância ou Similaridade de Cosseno ............................................................................. 81 4.1.5 Grafos de Interação .......................................................................................................... 85 4.1.6 Mineração de Texto ......................................................................................................... 87 4.2 RECURSOS DO PROTÓTIPO EDMXP ................................................................................... 90 4.2.1 Módulo de Consultas ....................................................................................................... 92 4.2.2 Módulo de Pré-processamento......................................................................................... 94 4.2.3 Módulo de EDM .............................................................................................................. 96 4.2.4 Módulo de Text Mining (TM) ....................................................................................... 100 4.2.5 Módulo de Recursos Analíticos ..................................................................................... 104 4.3 PROCEDIMENTOS PARA UTILIZAÇÃO DO PROTÓTIPO EDMXP ................................ 110 4.3.1.Selecionar amostragem .................................................................................................. 110 4.3.2. Consolidar dados dos cursistas ..................................................................................... 110 4.3.3. Relatórios ..................................................................................................................... 111 4.3.4. Classe e categoria de ação – Comportamento on-line do cursista ................................. 111 4.3.5. Percurso de aprendizagem ............................................................................................ 112 4.3.6 Gerar grafo .................................................................................................................... 112 4.3.7 Espiral de aprendizagem e ciclo de ações ...................................................................... 112 4.3.8 Aplicar o modelo de TM para obter o gráfico da Espiral de Aprendizagem e Ciclo de ações ....................................................................................................................................... 112 4.3.9 Gerar o relatório de probabilidade de cumprimento da Espiral de aprendizagem e ciclo de ações ....................................................................................................................................... 113 4.3.10 Obter a troca de mensagens entre “Cursistas e Cursistas” e “Professor e Cursistas” ... 113 4.3.11 Gerar gráfico contendo as trocas de mensagens entre “Cursistas e Cursistas” e “Professor e Cursistas” ........................................................................................................... 113 4.3.12 Identificação de postagens curtas no fórum ................................................................. 113 4.3.13 Identificação do desempenho de postagens no fórum .................................................. 113 4.3.14 Associar o desempenho de postagens com as postagens curtas no fórum .................... 114 4.3.15 Gráfico do desempenho dos cursistas em função das postagens curtas ........................ 114 4.4 Considerações .......................................................................................................................... 114 CAPÍTULO 5 - RESULTADOS E DISCUSSÃO .............................................................................. 115 5.1 TÉCNICAS DE EDM APLICADAS NA DETECÇÃO DE INDÍCIOS DO CONTEXTO DO CURSISTA .................................................................................................................................... 115 5.2 TÉCNICAS DE EDM APLICADAS NA DETECÇÃO DE INDÍCIOS DA ESPIRAL DE APRENDIZAGEM E CICLO DE AÇÕES .................................................................................... 144 5.3 TÉCNICAS DE EDM APLICADAS NA DETECÇÃO DE INDÍCIOS DA APRENDIZAGEM EM REDE ...................................................................................................................................... 154 5.4 TÉCNICAS DE EDM APLICADAS NA DETECÇÃO DE INDÍCIOS DO PAPEL DO PROFESSOR ................................................................................................................................. 163 5.5 TÉCNICAS DE EDM APLICADAS NA DETECÇÃO DE INDÍCIOS DA FORMALIZAÇÃO DE CONCEITOS ........................................................................................................................... 179 CONCLUSÕES ................................................................................................................................. 188 REFERÊNCIAS ................................................................................................................................. 197 APÊNDICE A - Arquivo ARFF: Perfil analítico completo do cursista .............................................. 208 APÊNDICE B - Arquivo ARFF: Dados do Perfil do cursista - Agrupamento ................................... 210 APÊNDICE C - Resultado da TM do contexto dos cursistas ............................................................. 211 APÊNDICE D - Comportamento On-Line dos Cursistas (Algoritmo VSM)...................................... 225 APÊNDICE E - Média do Comportamento On-Line dos Cursistas (Algoritmo VSM) ...................... 234 APÊNDICE F - Gráficos da Espiral de Aprendizagem e do Ciclo de Ações...................................... 236 APÊNDICE G - Mensagens Postadas entre "Cursistas e Cursistas" e "Professor e Cursistas" ........... 243 APÊNDICE H - Cluster gerado pelo Algoritmo Simple KMeans ...................................................... 247 APÊNDICE I - Arquivo ARFF: Troca de mensagens nos fóruns (Completo) .................................... 256 ANEXO I - Plano de Trabalho: Redefor/Unesp ................................................................................. 263 1 APRESENTAÇÃO Muitos documentos sobre o tema ciência afirmam que uma tese tem origem na observação crítica de uma situação que gera um problema, pois trata-se de uma proposição intelectual que apresenta o resultado de uma investigação profunda e complexa, a respeito de um determinado problema, com aporte teórico bem definido. No entanto, o problema de pesquisa de uma tese não surge rápida e facilmente. Convém, portanto, antes de adentrar no mérito desta questão, expor uma breve reflexão sobre os aspectos convergentes da trajetória pessoal, profissional e acadêmica do autor para que seja possível compreender como tais elementos se encontram intimamente ligados e se constituem na razão de ser desta pesquisa de doutorado. Nasci e cresci na cidade de Marília, interior do estado de São Paulo, analista de sistemas e professor universitário, com graduação em Processamento de dados e mestre em Ciência da Computação na área de concentração de Arquitetura de sistemas computacionais. Trabalho com tecnologias da plataforma Java, desenvolvendo soluções comerciais, e como professor de ensino superior trabalho para um grupo de faculdades em cursos de graduação nas áreas de Administração de empresas e Engenharia civil. Ingressei no mercado de trabalho aos 15 anos de idade e tive muita sorte, pois fui contratado, inicialmente, como office-boy em uma empresa de destaque nacional do ramo de soja e açúcar. Foi nesta empresa que tive a oportunidade de adentrar em um Centro de Processamento de Dados (CPD) de verdade pela primeira vez e onde meses depois, devido a alguns conhecimentos que possuía na área da programação de computadores (um diferencial em uma época em que profissionais desta área ainda eram raros), também tive a minha primeira oportunidade profissional na área da computação. Ao concluir o segundo grau (atual ensino médio), trabalhando como programador de computadores na Universidade de Marília (Unimar), pude cursar graduação em Processamento de dados com bolsa integral por ter concluído com êxito a migração do sistema para a nova plataforma Unix 1 , além de receber uma nova promoção, desta vez, para o cargo de Analista de sistemas. A Itautec-Philco 2 , então fornecedora de equipamentos para os laboratórios de informática da Unimar concretizou uma parceria para o desenvolvimento de tecnologias para 1 Sistema operacional portável, multitarefa e multiusuário originalmente criado por Ken Thompson e Dennis Ritchie nos Laboratórios Bell da AT&T. (http://www.opengroup.org/unix) 2 http://www.itautec.com.br 2 terminais de autoatendimento e fui indicado a trabalhar neste projeto por dois anos, dividindo o meu tempo entre as cidades de Marília e São Paulo. Isso representou também uma grande oportunidade, pois foi um período de novidades e de motivação por ter acesso a tecnologia de ponta e estar, pela primeira vez, trabalhando em um centro de pesquisa e desenvolvimento que combinava competências acadêmicas e mercadológicas, despertando meu interesse em pesquisa científica. Trabalhar em uma empresa com as modernas instalações da matriz Itautec, no centro de negócios do país, e ter a oportunidade de participar do processo de criação de um novo produto intensificou o meu desejo de cursar mestrado. O problema era: como? Foi então que, recém formado e com um bom emprego, decidi abrir uma pequena empresa de treinamento e desenvolvimento de sistemas com a ilusão de conseguir "montar meu próprio horário de trabalho" e ter condições de cursar a pós-graduação Stricto Sensu. Durante a graduação, não tive maiores problemas, pois percorri o caminho inverso de formação profissional. Aprendi primeiro no contexto prático (mercado) e depois no teórico (graduação). Naquela época, por ser profissional da área da computação, muitos colegas de sala pediam aulas particulares de programação de computadores, o que serviu como mais um fator motivacional para ingresso na carreira acadêmica no futuro, além conhecer as dificuldades que a maior parte das pessoas tem em relação ao aprendizado de técnicas de programação de computadores. Após superar as maiores dificuldades com a minha empresa, retomei a busca por informações para ingresso no sonhado programa de pós-graduação. O mestrado foi um período muito especial (e difícil) da minha vida, principalmente por ter professores de altíssimo nível e por aprender grandes lições individuais com cada um deles, a citar: Dr. Marcos Luiz Mucheroni 3 (meu orientador), Dr. Jorge Luiz e Silva 4 , Dr. Edward David Moreno Ordonez 5 , Dr. Shusaburo Motoyama 6 e Dr. Ildeberto Aparecido Rodello 7 . As disciplinas ocorriam semanalmente, consistindo em uma imersão teórica segundo a proposta de cada disciplina e, na sequencia, implementávamos um modelo em software de tudo aquilo que havíamos estudado. Ainda nas disciplinas, fazíamos avaliações e críticas a artigos da ACM (Association for Computing Machinery) ou da IEEE (Institute of Electrical 3 Lattes: http://lattes.cnpq.br/7224504768054079 4 Lattes: http://lattes.cnpq.br/2869976839293137 5 Lattes: http://lattes.cnpq.br/8377190526783442 6 Lattes: http://lattes.cnpq.br/6758424820066305 7 Lattes: http://lattes.cnpq.br/3616991101436026 3 and Electronics Engineers). Com base neles, elaborávamos seminários para os encontros dos grupos de estudo envolvendo alunos da graduação e da pós-graduação. Além disso, era preciso elaborar uma monografia ao final de cada disciplina, de acordo com a temática proposta por cada professor. Foi nesta época que tive a oportunidade de participar de dois eventos importantes: o LAPTEC (International Congress of Logic Applied to Technology - Congresso Internacional de Lógica Aplicada à Tecnologia) e o CBIS (Congresso Brasileiro de Informática na Saúde). Foram nesses eventos que publiquei os resultados iniciais das pesquisas realizadas nas disciplinas e de implementação do meu projeto de mestrado. Neste período, também produzi como coautor, um artigo que se tornou um capítulo de livro (MUCHERONI, 2003), publicado em Amsterdam, Holanda, pela IOS Press na série "Advances in Intelligent Systems and Robotics", volume 101, intitulado "Auto-organizing Agents in Ontologies with Intentions - Agentes de Auto-organização em Ontologias com Intenções". Cabe salientar que submeti outro artigo a um evento da IEEE, o CSM (International Conference on Software Maintenance), ocorrido em Budapeste, na Hungria. Neste trabalho, no entanto, tive alguns problemas, pois a data limite coincidia com o período em que eu efetuava ajustes importantes nos experimentos e procurava me concentrar na escrita final da dissertação. Infelizmente, não consegui traduzir adequadamente o texto para a língua inglesa em tempo hábil, que continha boa parte dos resultados obtidos em minha pesquisa. Com as datas de qualificação e defesa se aproximando, decidi por não efetuar a revisão do artigo. Após ter concluído os créditos, fui indicado para uma vaga de professor na instituição onde estou até hoje. A instituição é formada por quatro faculdades localizadas nas cidades de Marília, Garça, Itapeva, no estado de São Paulo, e a última em Jaciara no Mato Grosso. Inicialmente, na unidade de Garça, fui alocado aos cursos de Sistemas de Informação e Administração de empresas (e mais tarde também nos cursos de Engenharia florestal, Agronomia e Turismo). Na unidade de Jaciara-MT, devido a abertura do curso de Sistemas de Informação, fui incumbido de ajustar o curso segundo as necessidades da região até o recebimento da comissão de autorização de curso do INEP/MEC. Na unidade de Itapeva-SP atuei como coordenador do curso de Sistemas de Informação. E, em Marília, estou alocado ao curso de Administração de empresas e, agora, esporadicamente, também no curso de Engenharia civil. Esta instituição tem como pontos fortes os veículos e eventos científicos que permitem aos professores publicar juntamente com os alunos, os resultados de seus trabalhos de 4 pesquisa. Desta forma, tenho participado de todas as edições dos simpósios nas unidades de Garça e Marília. Tenho realizado ao longo desses anos, inúmeras orientações em trabalhos de iniciação científica, em trabalhos de conclusão de curso e na produção de artigos científicos publicados nos eventos da própria instituição. Foram nestes veículos científicos que fiz os primeiros ensaios com foco em Educação a partir do conhecimento adquirido durante as disciplinas cursadas no PPGE (Programa da Pós-Graduação em Educação) da FCT/Unesp de Presidente Prudente-SP. Para participar do processo seletivo de doutorado empreendi esforços, de tal forma que meus modestos conhecimentos em computação pudessem gerar contribuições para a comunidade acadêmica e sociedade em geral, a partir da área da Educação. Inicialmente, convém relatar o principal motivo que me fez optar pela "Linha 2 - Processos Formativos, Ensino e Aprendizagem" do Programa de Pós-Graduação em Educação do PPGE da Unesp de Presidente Prudente: Há anos venho observando as dificuldades enfrentadas por alunos de cursos de áreas da Computação e Engenharias quanto ao aprendizado de linguagens de programação de computadores. Considerando que sempre ministrei disciplinas e treinamentos na área de programação de computadores, busquei por recursos e técnicas que me permitissem complementar tais atividades de ensino. Para isso, fiz leituras de publicações que abordavam o tema "dificuldades no aprendizado de linguagens de programação" e descobri que tratava-se de um problema global e não apenas local, como eu supunha. Econtrei nas publicações da Carnegie Mellon University as respostas mais esclarecedores. Então, passei a ofertar aos meu alunos, como atividades extracurriculares, treinamentos realizados a distância. Isso me permitiu tratar as necessidades individuais dos alunos de forma personalizada e os resultados positivos começaram a aparecer. Assim, busquei plataformas mais completas que viabilizassem uma melhor interação. Em busca de mais informações sobre Educação a Distância (EaD), ao ler o artigo "Barriers to Adoption of Online Learning Systems in U.S. Higher Education", de Bacow et al (2012), descobri as necessidades de desenvolvimento tecnológico que esta área demanda, os principais obstáculos e as características esperadas para os próximos anos para as plataformas de EaD, bem como, pude manter contato direto por e-mail com um dos autores do artigo, o que tornou possível a obtenção de mais detalhes (e dicas) sobre a resolução dos problemas. Realizei pesquisas em instituições de renome que desenvolviam pesquisas sobre o tema EaD e, neste contexto, a entrevista do Dr. Klaus Schlünzen Junior, coordenador do 5 NEaD/Unesp, concedida ao jornalista Ederson Granetto para UnivespTV a respeito dos projetos de EaD da Unesp (UNIVESPTV, 2012) e deixou-me impressionado. Na mesma época, li a tese de doutoramento da professora Elisa Tomoe Moriya Schlünzen (2000), intitulada "Mudanças nas Práticas Pedagógicas do Professor: Criando um Ambiente Construcionista, Contextualizado e Significativo para Crianças com Necessidades Especiais Físicas" (que descreve as mudanças comportamentais necessárias frente a dinâmica do ambiente CCS). Esta leitura levou-me a pensar em uma problemática relacionada a EaD segundo a abordagem Construcionista, Contextualizada e Significativa (CCS) 8 e também conduziu-me a leitura dos artigos de outros importantes pesquisadores como os Professores José Armando Valente e José Manuel Moran. Percebi que o uso de metodologias e abordagens educacionais mais adequadas às modalidades a distância e híbridas, passaram a ser temas amplamente explorados por programas de pós-graduação, tanto para os níveis de mestrado quanto de doutorado em todo o mundo e em diferentes áreas da ciência, como por exemplo, a iniciativa MOOC (Massive Open Online Course) edX 9 (resultado da parceria entre a Universidade de Harvard e MIT). Durante a pesquisa para melhor definir o projeto de doutorado, encontrei artigos que abordavam a temática mineração de dados educacionais 10 (EDM, no original em inglês Educational Data Mining) e ao discutir sobre a relevância deste tema com o Professor Dr. Klaus Schlünzen Junior (orientador desta tese), foi possível perceber uma lacuna que envolvia o uso de um AVA em cursos segundo uma abordagem CCS. Surgiram, então, as questões iniciais que desencadearam esta pesquisa: Como apontar indícios da abordagem CCS em cursos da modalidade híbrida? Como isso poderia ser sistematizado e implementado? Quais seriam as tarefas de EDM mais adequadas? Como deveria ser o processo de preparação e pré- processamento desses dados para EDM? Como seria o processo de análise dos resultados obtidos por meio da EDM? Qual seria o tamanho adequado da amostragem para demonstrar o potencial de EDM? Como tornar este recurso disponível aos professores e pesquisadores que desconhecem as técnicas e ferramentas de EDM? 8 A abordagem CCS é aquela em que o cursista utiliza a tecnologia como instrumento para produzir algo que parte da sua vivência e realidade, com apoio do professor e ao se deparar com os conceitos curriculares, formaliza esses conceitos (SCHLÜNZEN, 2000; 2015; SANTOS, 2015). 9 https://www.edx.org/ 10 A mineração de dados educacionais consiste no desenvolvimento de métodos e técnicas orientados a explorar dados produzidos em ambientes educacionais, normalmente, em formato digital, para melhor compreender o comportamento dos cursistas e em quais condições eles aprendem (IEDMS, 2016). 6 Esta tese foi elaborada neste contexto e encontra-se em conformidade aos elementos descritos na ementa da linha de pesquisa do PPGE, especialmente no tocante a investigação dos processos e práticas pedagógicas desenvolvidas no espaços escolares e educativos em diferentes contextos socioculturais ao abranger estudos sobre fundamentos e concepções teórico-metodológicos nos processos de ensino e aprendizagem; múltiplas linguagens, mídias e tecnologias em diferentes modalidades de Educação e áreas do conhecimento; Educação inclusiva; formação inicial e continuada de professores e seu impacto na prática educativa e escolar. 7 CAPÍTULO 1 - INTRODUÇÃO Este capítulo contempla a contextualização do tema de pesquisa e sua relevância para que seja possível contribuir para o avanço das pesquisas em Educação nas modalidades híbrida, a distância e presencial segundo a abordagem CCS. Constam ainda as justificativas, a definição do problema de pesquisa, objetivos geral e específicos e a organização desta tese. 1.1 CONSIDERAÇÕES INICIAIS É possível perceber que o grande avanço das TDIC (Tecnologias Digitais da Informação e da Comunicação) possibilitaram o surgimento de uma infraestrutura com características inovadoras, que viabilizaram a construção de uma base coletiva de produção de conhecimento capaz de transpor limites sociais, geográficos, cronológicos, culturais, técnicos e científicos. Como consequência, diversas áreas da ciência têm passado por mudanças significativas e a Educação, apesar de influenciada pela tendência de modernização e globalização dos mercados, não acompanha esse movimento. Com o aumento da oferta e da disponibilidade de uma diversidade de recursos, os horizontes de atuação na Educação se ampliaram e, neste cenário, destaca-se a Blended Learning, uma modalidade de Educação em que parte das atividades são realizadas a distância e outra de forma presencial. Considera-se possível potencializar esta modalidade de Educação e aprendizagem com uma abordagem moderna e dinâmica como a Construcionista, Contextualizada e Significativa (CCS), que faz uso de diversos recursos pedagógicos e tecnológicos para viabilizar a construção do conhecimento, em um modelo flexível, híbrido e personalizado, pois possibilita que o cursista 11 seja o maior responsável por seu próprio processo de aprendizagem (SCHLÜNZEN, 2015; SANTOS, 2015). Desta forma, os cursistas passam a construir os seus conhecimentos segundo os seus estilos de aprendizagem, ao utilizar para isso, metodologias ativas com apoio tecnológico e a motivação surge a partir dos cursistas (SCHLÜNZEN, 2015; SANTOS, 2015). A abordagem CCS combina o trabalho com projetos e as TDIC em temáticas contextualizadas e significativas, com as quais o professor tem as devidas condições 11 De acordo com o Dicionário Escolar de Língua Portuguesa da Academia Brasileira de Letras (ABL, 2008), os termos "aluno", "estudante" e "cursista" podem ser igualmente utilizados para referenciar aquele que deseja ser o protagonista do seu próprio processo de aprendizagem. 8 para mudar suas práticas e agir mais como um orientador do que um mero interlocutor de conteúdos (SCHLÜNZEN, 2015; SANTOS, 2015). Cabe, portanto, as instituições de ensino implementar as condições necessárias para que os cursistas possam desenvolver sua autonomia, de tal forma que, o professor seja capaz de desenvolver e desempenhar o importante papel de mediador, conselheiro, orientador e parceiro do cursista na busca por informações que estabeleçam ambientes de aprendizagem favoráveis a construção do conhecimento. Em um ambiente que a Educação acontece com o auxílio das TDIC, pode-se imaginar a produção de uma enorme quantidade de dados em formato digital que, na maioria das vezes, não são utilizados sob a ótica analítica. Esses dados, normalmente armazenados apenas para fins de controle não são submetidos a um processo de análise para melhor compreender o ambiente em que ocorre a aprendizagem. Para garantir uma aprendizagem CCS em cursos ofertados nas modalidades Blended Learning e EaD que fazem uso de um AVA (Ambiente Virtual de Aprendizagem) é necessário verificar como ocorrem as relações e a construção de produtos. Trata-se de uma tarefa difícil, pois as evidências destas relações não podem ser encontradas explicita e facilmente nos registros eletrônicos dos AVA. É neste contexto que emerge a EDM, uma tecnologia derivada da mineração de dados (DM, no original em inglês Data Mining) que mescla conhecimentos das áreas da Computação, Estatística e Educação para possibilitar a descoberta do conhecimento oculto em grande volume de dados educacionais digitais, muitas vezes, dispersos em diferentes repositórios de dados (ROMERO e VENTURA, 2013). 1.1.1 Justificativa e Relevância A frase (supostamente) de autoria de Albert Einstein “Insanidade é continuar fazendo sempre a mesma coisa e esperar resultados diferentes” reflete bem o propósito desta pesquisa. A sociedade tem vivenciado transformações aceleradas e a Educação se encontra no centro dessas mudanças e desafios, pois novas abordagens de ensino e de aprendizagem têm sido adotadas. No discurso de grande parte das instituições de ensino encontram-se metas como a formação de pessoas autônomas e críticas. Contudo, o desenvolvimento da autonomia dos indivíduos, como seres pensantes, críticos e participativos descritos nos objetivos de diversos projetos pedagógicos, de propostas metodológicas e igualmente presente no discurso dos gestores e professores, não tem se concretizado. 9 Como ressalta Dewey (PENAFORTE, 2001), trata-se de um processo educacional que é incapaz de produzir pessoas dotadas do hábito de aprender por toda a vida termina por roubar delas sua capacidade potencial de lidar com situações desconhecidas. De mesmo modo, Mandela (2003) afirma que a "Education is the most powerful weapon we can use to change the world - Educação é a arma mais poderosa que podemos usar para mudar o mundo". A Constituição Federal Brasileira (BRASIL, 1988), em seu Art. 6º, declara que a Educação consiste em um dos direitos sociais do cidadão brasileiro. No Art. 205º diz que a "Educação é um direito de todos e dever do Estado e da família, que será promovida com a colaboração da sociedade, visando o pleno desenvolvimento da pessoa, seu preparo para o exercício da cidadania e sua qualificação para o trabalho". No entanto, como observa Schlünzen (2015), apesar dos esforços das Secretarias Municipais, Estaduais e do Governo Federal, constata-se um processo assíncrono relativo as teorias e práticas, no tocante a Educação comum e a inclusão, o que acaba por promover uma dicotomia entre a legislação e as práticas. Em pleno século XXI, alguns segmentos da sociedade global ainda resiste, por diversos motivos, a penetração das TDIC nos ambientes educacionais, seja para realizar projetos ou para complementar o ensino executado de forma tradicional. Cohon (2012) compara esse cenário com a indústria a partir dos anos de 1950, quando as tecnologias computacionais passaram a ser vistas como instrumentos capazes de gerar diferenciais competitivos e incrementar a capacidade produtiva ao viabilizar a redução de custos e favorecer a tomada de decisão. Talvez por isso, Freire (FREIRE e PAPERT, 1995) tenha classificado o estado da escola, de forma muito polida, como "péssima", mas que para ele a questão não consiste em acabar com a escola, mas sim, transformá-la, tornando-a uma entidade tão atual quanto a tecnologia, colocando a escola a altura do seu tempo. Em conformidade com esta proposta, Papert (FREIRE e PAPERT, 1995) sugere a adoção das TDIC na Educação como algo que permitirá ao estudante ser capaz de rejeitar a opressão (do modelo tradicional de ensino) (FREIRE, 1970) e se manter dentro de um senso de curiosidade que tinha desde que era criança, ressaltando a escola como o local onde as pessoas devem ir e se encontrar para aprender, e ressalta que nunca as TDIC poderão substituir a escola. Por isso, exalta que o papel dos professores é encontrar um novo caminho e buscar novas práticas pedagógicas que privilegiem o protagonismo do estudante em seu próprio processo de aprendizagem. 10 A professora Loriza Lacerda de Almeida, da Unesp, campus de Bauru, no evento "Práticas Pedagógicas" 12 alertou para as mudanças que ocorrem dentro da sala de aula e que o professor deve compreender as mudanças de geração dos estudantes, pois, vivemos um momento de ruptura comportamental, no qual novos costumes, atitudes e objetivos exigem maior flexibilidade e que devemos aproveitar tal oportunidade para construir uma nova sociabilidade e cultura. É preciso, antes de mais nada, reconhecer que os jovens possuem novos padrões comportamentais, alto nível consumo de informação e de tecnologia. Por isso, é necessário refletir, antes de tudo, na formação do docente e na qualidade de suas práticas, fazendo-se necessário compreender o processo de formação e do desenvolvimento dos saberes docentes, bem como, tornar disponível e acessível à este profissional, ferramentas analíticas que permitam melhor compreender os cenários atuais que envolvem a Educação e os seus personagens. Nóvoa (1999) nos adverte sobre a dicotomia a respeito do papel do professor na construção da chamada "Sociedade do futuro", pois há uma notória diferença entre a realidade discursiva e a realidade prática. Para ele, os professores são vistos com desconfiança, acusados de serem profissionais medíocres e possuírem formação deficiente e, em contrapartida, estes mesmos professores são considerados elementos essenciais para a melhoria da qualidade de ensino, crescimento social e cultural (no momento em que este discurso se faz oportuno), tanto pela sociedade (que faz uso de seus serviços) como pela classe política (que implementa as normas a respeito de sua atuação e formação). É notório, portanto, que sejam implementadas mudanças nas práticas pedagógicas. Em sua tese de doutorado, Schlünzen (2000) propôs um ambiente para uma nova prática, que parte do professor, no trabalho com crianças com necessidades especiais físicas, no qual buscou desenvolver um processo ensino-aprendizagem colaborativo, integral em busca da totalidade, que propõe uma nova perspectiva para uma nova forma de aprender e ensinar por meio do desenvolvimento de projetos e que utiliza as TDIC como ferramentas para uma aprendizagem que parte do contexto da criança, relacionando-a à sua realidade sendo, portanto, significativa para o cursista. Este é o ambiente Construcionista, Contextualizado e Significativo (CCS). De acordo com Schlünzen (2015, p.28-29), é nesse cenário que os processos de formação inicial e continuada passaram a ser propostos em uma abordagem CCS, voltada mais para o desenvolvimento do indivíduo e menos para a absorção de informações. Mesmo 12 O evento "Práticas Pedagógicas" aconteceu na Faculdade de Medicina de Botucatu (FMB), no campus da Unesp de Botucatu em 24 de Maio de 2013. 11 porque, na “sociedade do conhecimento”, a aquisição de informações pode ser realizada em todos os lugares e a qualquer momento, ao passo que a elaboração, a organização, a sistematização e a construção do conhecimento podem ser feitas dentro da escola (FREIRE e PAPERT, 1995). Além disso, ter a oportunidade de permitir à sociedade educacional usufruir dos benefícios das tecnologias, favorecer cada vez mais os processos de ensinar e de aprender, são fundamentais dentro dessa abordagem. Ao analisar a abordagem proposta por Schlünzen (2000) percebe-se um problema que agrava ainda mais o cenário da Educação brasileira quando se incluí nesta discussão os estudantes público-alvo da Educação especial (EPAEE). Assim, ao pensar a Educação de forma global é preciso ressaltar a Educação Especial em uma perspectiva inclusiva, pois é preciso que a sociedade e a comunidade científica, em particular, busquem formas de incluir os EPAEE (SCHLÜNZEN, 2015). É possível vislumbrar que, se articuladas da maneira correta, as TDIC podem favorecer a inclusão por meio da oferta de ambientes (como o ambiente CCS) capazes de transformar a realidade, potencializar as habilidades e tentar equilibrar as condições de ensino e aprendizagem aos EPAEE. Por exemplo, ao utilizar a abordagem CCS em um AVA, diferenças como alguma dificuldade ou deficiência tendem a ser minimizadas e as qualidades dos indivíduos potencializadas. Enquanto a sociedade aguarda ansiosa por tais mudanças, neste exato momento, uma grande quantidade de dados em formato digital está sendo gerada e armazenada em escala global, nas mais diversas áreas do conhecimento por meio de recursos digitais e computacionais, móveis ou não. A esse respeito, Cortês (2008) afirma que todo sistema de informação tem por finalidade duas premissas básicas. A primeira diz respeito aos processos de controle de dados, centradas nas operações de coleta, armazenamento, processamento e recuperação de informações. A segunda sobre a capacidade de tomar decisões com base nestas informações. Pode-se, portanto, vislumbrar que há grande necessidade em gerar teorias e ferramentas computacionais para auxiliar professores, por exemplo, a extrair informação útil (e gerar o conhecimento) a partir do rápido crescimento do volumes desses dados digitais. É cada vez maior o número de instituições de ensino que passaram a adotar um AVA para o ensino nas modalidades a distância (EaD), semipresencial (Híbrida ou Blended Learning) e também na presencial. Independentemente da modalidade, grandes volumes de dados digitais são produzidos nesses ambientes educacionais, o que gera questões-chave (COSTA et al., 2012), como: o que especificamente fazer com esses dados educacionais? 12 Como reverter estas informações em benefícios para as instituições, para estudantes e professores envolvidos no contexto de um curso? Como cada um destes atores podem identificar e utilizar as informações ocultas nos dados coletados de tal modo que consigam tirar proveitos delas? Entre outras. Isso deu origem a uma nova área de pesquisa científica, a EDM, cuja preocupação é o desenvolvimento de métodos capazes de explorar dados digitais gerados em contextos educacionais para melhor compreender o comportamento dos cursistas e em quais condições eles aprendem em um AVA (IEDMS, 2016), ao combinar conhecimentos oriundos da Ciência da Computação, Estatística e Educação (ROMERO e VENTURA, 2013). Trata-se da adaptação das técnicas de DM para solucionar problemas educacionais. Na abordagem CCS, as pesquisas mais relevantes, realizadas e em andamento, partiram de iniciativas dos projetos de extensão, pesquisa e cursos desenvolvidos no âmbito do grupo Ambientes Potencializadores de Inclusão (API) e das pesquisas de mestrado e doutorado do Programa de Pós-Graduação em Educação (PPGE), ambos da Faculdade de Ciências e Tecnologia da Universidade Estadual Paulista “Júlio de Mesquita Filho” (FCT/Unesp), câmpus de Presidente Prudente-SP. Em EDM, há muitas contribuições teóricas, mas ainda poucos relatos de resultados práticos, o que confirma as declarações de Romero (2013), Ventura (2014) e, Romero e Ventura (2013). Ao considerar a aplicação de técnicas de EDM em abordagens construcionistas, os relatos científicos tornam-se ainda mais escassos, como por exemplo, àquele de Berland, Baker e Blikstein (2014). Por isso, acredita-se que a EDM e a abordagem CCS se constituem em um campo fértil de exploração e contribuição científica, e até o momento da conclusão desta tese, não foi encontrada na literatura científica de referência (IEDMS, 2016; ROMERO e VENTURA, 2010; HEGAZI e ABUGROON, 2016) nenhuma pesquisa com resultados similares àqueles expostos. 1.1.2 Definição do Problema As bases teóricas do ambiente e da abordagem CCS estão descritas na tese de Schlünzen (2000) “Mudanças nas Práticas Pedagógicas do Professor: Criando um Ambiente Construcionista, Contextualizado e Significativo para Crianças com Necessidades Especiais Físicas”, que estabeleceu meios para que novas práticas pedagógicas de professores para favorecer o processo ensino e aprendizagem das crianças com deficiências por meio de 13 estratégias baseadas no uso de metodologias ativas de aprendizagem, especificamente, a aprendizagem baseada em projetos, na qual as TDIC foram utilizadas como recursos potencializadores de aprendizagem dos conceitos disciplinares. Com o passar do tempo e de inúmeros esforços, a consolidação da abordagem CCS abriu possibilidades de melhorias para os processos de ensino e aprendizagem de maneira geral, bem como, favoreceu ainda mais a inclusão de EPAEE. No entanto, na abordagem CCS, o aspecto fundamental é o comprometimento profissional do professor, pois ele deve ter disposição para modificar sua prática ao gerar um processo constante de formação, reflexão e diálogo, utilizar metodologias ativas de aprendizagem e as TDIC. Desta forma, o que se espera do professor é que seja capaz de perceber a importância que seu novo papel propõe, uma vez que deve ultrapassar os limites da transmissão de informações e buscar meios de estabelecer uma relação mais próxima com o cursista. Este novo professor deve desenvolver sua habilidade de analisar e de perceber as limitações e as possibilidades individuais para que os envolvidos passem a acreditar em suas capacidades autônomas. Uma tarefa difícil, segundo Schlünzen (2015), mas possível de se realizar, uma vez que as habilidades do cursista passam a ser externalizadas no decorrer do processo de construção, de algo que faça parte do seu contexto e, portanto, lhe é significativo. No contexto dos cursos de Educação Especial na Perspectiva da Educação Inclusiva (Programa Redefor/Unesp 13 ), de acordo com Schlünzen (2015), uma das ações adotadas para verificar como os cursistas têm observado os aspectos da formação para benefício de sua prática ou como estão relacionando os conteúdos pedagógicos com o contexto, ou seja, se estão se apropriando da abordagem CCS, é reunir no AVA de equipe 14 , os depoimentos destes cursistas no decorrer das disciplinas. Assim, a coordenação e as demais equipes puderam acompanhar, refletir, intervir e atuar continuamente para a melhoria dos cursos. 13 De acordo com Schlünzen (2015), no início de 2014, por meio de um convênio assinado entre a Unesp e Secretaria da Educação do Estado de São Paulo (SEE-SP), deu-se início, pelo programa Redefor (Rede São Paulo de Formação Docente) de Educação Especial e Inclusiva, o planejamento de sete cursos de especialização na área de Educação Especial (cada um com certa de 100 vagas) e um curso de Educação Especial na Perspectiva da Educação Inclusiva (com 1.000 vagas), elaborados segundo a abordagem CCS, na modalidades semipresencial (Blended Learning), em formato acessível, tendo como público-alvo professores e gestores da rede pública estadual com interesse em atuar nas salas de recursos como professores especializados. Teve previsão de término o ano de 2016. 14 O AVA de equipe foi instituído para garantir a formação em termos de certificação e aprimoramento profissional dos TO (Tutores On-line), na forma de um curso de aperfeiçoamento, dentro do AVA Moodle, voltado ao compartilhamento das experiências vivenciadas junto aos cursistas, das ideias e conceitos construídos na formação com os autores e da problematização dos aspectos inerentes à mediação pedagógica dentro dos pressupostos do EJV, caracterizando a formação em serviço e com significado também para os TO (SCHLÜNZEN, 2015). 14 Este processo, de buscar indícios da abordagem CCS no depoimento dos cursistas (agrupados no AVA) sugere que sua obtenção ocorre por meio de intervenção humana, uma atividade manual, exaustiva e, muitas vezes, sujeita a interpretações dúbias ou imprecisas, principalmente se considerarmos o elevado número de cursistas matriculados ativos, o que supostamente, levaria os operadores do AVA a duas condições. Na primeira, fariam a busca destes relatos um a um, ou seja, iriam “minerar” em todos os registros de atividades de cursistas matriculados, o que consumiria muito tempo e poderia inviabilizar tal tarefa. E, na segunda, fariam a seleção e coleta por amostragem, justamente, para contornar a primeira condição. De qualquer forma, percebe-se um grande esforço manual da coordenação e demais membros da equipe nesta tarefa de acompanhar o cursista para que seja possível refletir, avaliar e propor melhorias contínuas dos cursos. Diante do exposto, feitas as devidas considerações iniciais inerentes a uma abordagem de Educação (CCS) que utiliza as TDIC como uma atividade meio (não como atividade fim), fica evidente o esforço humano necessário para acompanhar aspectos que devem estar presentes na formação do cursista e que constituem apenas uma parte do problema. Ao incluir a EDM neste cenário, surgem outros dois problemas. Por ser a EDM derivada da Ciência da Computação, a primeira dificuldade reside em implementar um modelo computacional capaz de abstrair e solucionar o problema (ou pelo menos, parte dele), pois (em computação) tudo é finito e os algoritmos dependem dos chamados Dados discretos, ou seja, um problema deve possuir limitações claras ou estados muito bem definidos (que garantam previsibilidade). Para que se tenha uma ideia do desafio computacional que isso representa, vamos supor que, de alguma forma, foram identificadas (apenas) cinco características ou parâmetros bem definidos e relevantes da abordagem CCS que possam ser localizados, identificados e mensurados em AVA. Digamos que foi possível determinar que seria preciso encontrar, nas práticas de um cursista, a combinação de três a cinco destas características para que se possa deduzir se "há indícios da abordagem CCS nas práticas do cursista". Ao considerar apenas esta suposição, temos o problema de mineração de itens frequentes em função da análise combinatória destes cinco parâmetros CCS, no qual seria preciso encontrar as possíveis variações e buscá-las nos registros do banco de dados do AVA para cada cursista ou curso que se deseja analisar. Emerge daí o segundo problema atrelado ao campo da Estatística. Para chegarmos ao número de combinações possíveis e que, portanto, não se repetem, é preciso utilizar a análise combinatória simples, que pode ser representada pela fórmula: 15     p!!pm m! =pm,C na qual: m = número de elementos p = número de tomadas Neste exemplo, o que se pretende encontrar é a somatória das combinações (tomadas) possíveis e, por isso, representada por: C(5,5)+C(5,4)+C(5,3) ou seja, 1 + 5 + 10 = 16 A Figura 1 ilustra os resultados da análise combinatória, nos quais há destaque para os dezesseis possíveis casos (demarcados pelo retângulo) que variam de três a cinco combinações. Figura 1 - Exemplo do conjunto de combinações possíveis Fonte: Adaptado de Zaki e Meira Jr, 2014. 16 Assim, o esforço consiste em testar (para encontrar) estas dezesseis tomadas para cada cursista, a fim de identificar se há ou não indícios da abordagem CCS nos registros destes cursistas no banco de dados do AVA. Agora, fora do campo das suposições, em um AVA real um cursista produz inúmeros registros em suas atividades (e não apenas uma para cada cursista, como no exemplo citado). Assim, o problema cresce exponencialmente se considerarmos que será necessário determinar muito mais do que cinco parâmetros CCS, bem como, utilizar outros métodos estatísticos na fase de pré-processamento. Um conjunto de processos, pode-se dizer, inviáveis de serem executados manualmente, mas que são imprescindíveis para contribuir com o desenvolvimento da abordagem CCS. Por isso, a fonte para coleta de dados da pesquisa deve garantir que sejam alcançados os resultados que se esperam. Para atender esta expectativa, foi possível contar com os registros de banco de dados do programa Redefor/Unesp (ANEXO I), pois trata-se de um conjunto de cursos que estão inseridos nesse contexto. Mesmo professores e pesquisadores devidamente qualificados para as atividades docentes, normalmente, não possuem proficiência suficiente quanto ao uso de conhecimentos estatísticos e recursos computacionais necessários para conduzir as mediações nas atividades de ensino e de aprendizagem, bem como, muitas vezes, encontram dificuldades operacionais para acompanhar o processo de aprendizagem no AVA. Desta forma, defende-se nesta tese que o uso das técnicas de EDM devidamente organizadas e estruturadas em um modelo computacional capaz de abstrair a complexidade das tarefas de EDM, além de possibilitar a identificação de indícios da abordagem CCS nas atividades dos cursistas, também podem contribuir na compilação dos resultados em linguagem mais adequada para professores e pesquisadores ao disponibilizar condições para ajudá-los a melhor gerenciar o processo de aprendizagem e, consequentemente, contribuir para o avanço da abordagem CCS. Portanto, ao considerar tais apontamentos, a pergunta que delimita o problema de pesquisa desta tese é: como identificar, por meio de técnicas de EDM, indícios da abordagem CCS em cursos da modalidade híbrida, a distância ou presencial? Para isso, esta indagação metódica desdobra-se nas seguintes questões norteadoras:  As informações possíveis de serem sistematizadas a partir da extração de dados do SGBD do AVA são suficientes para identificar o contexto do cursita? 17  Havia engajamento por parte do cursista? Com que frequência ele acessou o AVA e os recursos didáticos disponibilizados? Como e quando ele fez uso das ferramentas de comunicação (como o fórum)? Cumpriu as atividades de avaliação?  Quanto a espiral de aprendizagem e ciclo de ações, o cursista descreveu, executou, refletiu e depurou suas ideias ao participar das atividades propostas nos fóruns das disciplinas do curso?  Ao cumprir as atividades e participar dos fóruns das disciplinas, obteve e gerou contribuições (de cursistas e dos professores) a ponto de caracterizar uma aprendizagem em rede e a formalização de conceitos curriculares? 1.1.3 Objetivos: Geral e Específicos Esta pesquisa tem por objetivo geral aplicar as técnicas de EDM para apontar indícios da abordagem CCS nos cursos do programa Redefor/Unesp ofertados na modalidade híbrida, a distância e presencial. O objetivo geral se desdobra nos seguintes objetivos específicos: Definir os principais conceitos, aspectos históricos, evolução e mecanismos de ação da abordagem CCS, da Educação em modalidade híbrida ou Blended Learning mediada pela abordagem CCS e da Mineração de Dados Educacionais; Definir o delineamento metodológico, caracterizar as variáveis dependentes, independentes e intervenientes, bem como, a amostragem; Identificar as principais contribuições possíveis da área de EDM para o desenvolvimento da abordagem CCS; Implementar as técnicas para EDM em um protótipo de software para a identificação das categorias de análise da abordagem CCS nos registros do AVA; Selecionar, coletar, preparar, processar e analisar informações registradas em um banco de dados do AVA para as tarefas de EDM; e, por fim, evidenciar o resultado e as discussões frente as teorias que fundamentam a abordagem CCS e a EDM. 1.1.4 Definição dos termos Ao considerar a utilização de elementos advindos de diferentes áreas do saber, como Educação e Ciência da Computação, esta seção define os principais termos utilizados no decorrer do texto que podem gerar confusão quanto aos seus significados: 18  Abordagem: refere-se a todo aporte teórico que fundamenta as práticas, ou seja, o conjunto de métodos, procedimentos, princípios, tecnologias, os papéis e atitudes do professor, do TO e do estudante.  Algoritmo de mineração de dados: refere-se a uma sequência finita de instruções bem definidas e não ambíguas para cumprir uma determinada tarefa de mineração de dados.  Automatizado: refere-se ao conjunto de processos que exigiam esforços de execução manual e que passaram a ser realizados por meio de funcionalidade implementada em software.  Funcionalidade ou Atividade: refere-se ao termo utilizado na área da computação para definir uma ação ou comportamento com início e fim bem definido e que possa ser visualizado; portanto, passível de execução.  Implementação: na área da computação é a fase do ciclo de vida do software que implica em organizar os meios necessários para que as funcionalidades possam ser executadas, como por exemplo, planejar e codificar (com a utilização de uma linguagem de programação) uma rotina de cálculo.  Método: pode ter duas interpretações. A primeira, quando associada a abordagem, é o que possibilita utilizar a abordagem na prática, por meio de diferentes procedimentos e técnicas. A segunda, em termos gerais, refere-se a maneira de executar determinada ação, de acordo com certos princípios e em determinada ordem.  Percurso de Aprendizagem: refere-se ao conceito baseado no trabalho de Romero et al. (2008) relacionado ao planejamento da rota de aprendizagem definida para os estudantes seguirem um dado elemento do currículo. Não deve ser confundido com o conceito de Trilha de Aprendizagem oriunda da área da Educação corporativa.  Processo: refere-se ao conjunto de ações para atingir uma meta.  Recursos: são meios utilizados para romper uma dificuldade. Por isso, no Moodle, um recurso (resource) refere-se a uma ferramenta com a finalidade de auxiliar a aprendizagem ou a comunicação.  SGBD: é o acrônimo de Sistema Gerenciador de Banco de Dados. No entanto, nesta pesquisa, as menções ao termo referem-se ao banco de dados do ambiente virtual de aprendizagem Moodle, utilizado pelo Programa Redefor/Unesp, a partir do qual, os dados foram coletados. 19  Tarefa de mineração de dados: refere-se a um tipo de mineração de dados que possui um objetivo específico e pode ter diversas implementações por meio de diferentes algoritmos que, por sua vez, tem o mesmo objetivo. Por exemplo, nas tarefa de classificação encontram-se os algoritmos J48 e LADTree que são da família ou tipo de algoritmo Árvore de decisão (Decision Tree). 1.1.5 Indicação da metodologia Para definir o delineamento metodológico capaz de suprir as necessidades desta pesquisa, deve-se considerar que o curso de Educação Especial na Perspectiva Inclusiva do programa Redefor/Unesp, objeto desta pesquisa, já foi finalizado. Trata-se, pois, de uma pesquisa cuja abordagem é tanto quantitativa quanto qualitativa e enquadra-se no delineamento Ex Post Facto. Outro ponto a ser considerado refere-se as intensas pesquisas que envolvem a abordagem CCS e como ela é aplicada em cursos da modalidade híbrida, em busca de promover seu pleno desenvolvimento. Nesses cursos, devido ao grande volume de dados gerados no AVA em formato digital, torna-se inviável a adoção de procedimentos manuais para obter informações capazes de produzir o conhecimento necessário para a concretizar essas contribuições. É neste contexto que esta tese defende a utilização de técnicas de mineração de dados. A partir da explicitação da justificativa, da relevância, do problema, dos objetivos e da indicação metodológica, segue a organização deste documento científico. 1.1.6 Organização da Tese Ao considerar todos os pressupostos acadêmicos e científicos supracitados, o texto desta tese encontra-se organizado da seguinte forma:  Primeiramente, foi redigida uma breve apresentação da trajetória pessoal, profissional e acadêmica do autor desta tese de doutorado que pudesse ajudar no entendimento contextual que o conduziram ao elementos centrais deste trabalho. Em seguida, no Capítulo 1 são expostos os elementos introdutórios e delimitam a estrutura deste documento científico.  O Capítulo 2 tem por base os principais autores que fundamentam os aspectos teóricos da pesquisa, informações necessárias para que se possa compreender o que é a 20 abordagem CCS, como foi concebida, como ocorre seu desenvolvimento e sua relevância no contexto educacional, bem como, os componentes da área de mineração de dados educacionais.  O Capítulo 3 contempla a definição do delineamento metodológico da pesquisa, ou seja, descreve o percurso científico para responder as questões norteadoras e atender os objetivos desta tese, como a caracterização das variáveis dependentes, independentes e intervenientes, além de da definição da amostragem ao definir e descrever o programa Redefor/Unesp, e a descrição das etapas do planejamento para a seleção e coleta de dados.  O Capítulo 4 expõe as contribuições da área de EDM para o desenvolvimento da abordagem CCS ao descrever, por meio de um conjunto de dados que representam um contexto simples para mineração, as principais tarefas de DM utilizadas nos experimentos. Descreve os recursos implementados no protótipo da ferramenta EDMXP, concebida com o propósito de ofertar suporte às tarefas de seleção, pré- processamento, mineração de dados e suporte à análise de dados. Por fim, apresenta um roteiro para que o usuário comum possa utilizar o EDMXP em suas pesquisas, após ter recebido um breve treinamento, de acordo com o contexto especificado nesta tese.  O Capítulo 5 descreve os resultados e a discussão a partir dos procedimentos de análise, tendo por base a fundamentação teórica que sustenta esta tese e busca elucidar o caminho trilhado para solucionar o problema de pesquisa e como as questões norteadoras foram sendo resolvidas.  Por fim, encontram-se as Conclusões, nas quais estão sintetizadas as contribuições desta tese, aquelas que podem possibilitar o desenvolvimento da abordagem CCS e aquelas que podem auxiliar professores e pesquisadores a obter uma visão analítica e reflexiva a respeito de suas práticas, ao ofertar recursos para revê-las; estão expostos também os seus pontos relevantes e as dificuldades encontradas, aquelas que puderam e aquelas que não puderam ser superadas; em seguida, o Referencial Bibliográfico, os Apêndices e o Anexo. 21 CAPÍTULO 2 - DELINEAMENTO TEÓRICO DA PESQUISA Alinhada a Constituição Federal (BRASIL, 1988), a Sociedade Brasileiras de Computação (SBC, 2009) propôs em seu GD4 (Grande Desafio Grupo 4: Acesso universal; Aplicação: Educação) que todos os cidadãos devem ter acesso à Educação, considerando os diferentes níveis: Escola formal, primária e secundária, universitária (graduação e pós- graduação) e técnica, sendo que o acesso universal deve considerar a todos, promover benefícios e relevância social. Assim, para melhor compreender as contribuições desta tese, se faz necessário discutir os principais elementos conceituais e históricos relevantes que estão no contexto desta discussão. 2.1 ASPECTOS RELEVANTES DO AMBIENTE E ABORDAGEM CCS O mundo cada vez mais globalizado e competitivo impõe a sociedade um ritmo agressivo e imprevisível, e somente aqueles que se colocam de forma resiliente e capazes de desenvolver competências para responder aos desafios do século 21 (OCDE, 2015) tem maiores oportunidades de sucesso. Por esta razão, é necessário ajudar as pessoas a construirem um conjunto equilibrado de capacidades cognitivas e socioemocionais capazes de levá-las a se adaptarem ao mundo real atual e futuro. É nesse contexto que destaca-se o professor. No entanto, é bom lembrar que, Nóvoa (1999) fez duras críticas a esta retórica sobre o papel fundamental do professor na construção do que ele chamou "sociedade do futuro", na qual políticos e intelectuais procuram, cada um a sua mera conveniência, dignificar os professores pela valorização da profissão docente e ressaltam ainda a importância deles nos "desafios futuros". Portanto, é preciso concordar que, mesmo que os professores sejam considerados elementos essenciais para a melhoria da qualidade de ensino, e também do crescimento social e cultural, eles são vistos com desconfiança, acusados de serem profissionais medíocres (NÓVOA, 1999), reflexos de um contexto, em que burocratas definem vários problemas sociais e educacionais numa perspectiva gerencial e não numa perspectiva de conteúdo (VONK, 1991). De acordo com o NMC (2012), os programas de formação de professores devem refletir as necessidades dos estudantes da atualidade, que chegam ao ambiente escolar já acostumados a uma cultura de interatividade com o mundo e ideias, o que requer que os 22 programas de formação de professores venham a integrar a tecnologia adequadamente com a pedagogia, de tal forma que os professores recém-formados tenham a mínima compreensão de como as tecnologias comumente utilizadas fora das escolas possam ser utilizadas no ensino e no aprendizado. Por isso, as estratégias para o desenvolvimento da abordagem CCS promovidas pelo grupo de pesquisadores da Professora Dra. Elisa Tomoe Moriya Schlünzen tem como foco o desenvolvimento de novas formas de ensinar e de novos ambientes de aprendizagem por meio de ações orientadas a mudar o fazer dos professores, a partir da formação inicial até a continuada, a estimular a criatividade, a inventividade e a reflexibilidade a partir da conjugação do conhecimento sistematizado e da experiência, contextualizada e significativa, com os quais os professores tenham condições de executar movimentos contínuos para promover a construção do conhecimento (SCHLÜNZEN, 2015). Para que se possa desenvolver um processo de formação que tenha característica de continuidade é preciso que o professor seja capacitado à desenvolver competências (ALMEIDA, M.E., 1998), tais como: estar aberto a aprender a aprender, atuar a partir de temas emergentes no contexto e de interesse dos alunos, promover o desenvolvimento de projetos cooperativos, assumir atitude de investigador do conhecimento e da aprendizagem do aluno, propiciar a reflexão, a depuração e o pensar sobre o pensar, dominar recursos computacionais, identificar as potencialidades de aplicação desses recursos na prática pedagógica, desenvolver um processo de reflexão na prática e sobre a prática, reelaborando continuamente teorias que orientem sua atitude de mediação (ALMEIDA, M.E., 1998, p.2). Por isso é necessário romper com o paradigma do professor como "o ser que é o único dono dos saberes" e criar meios para conceber o ensino centrado nos cursistas. Assim, ganham espaço as metodologias ativas de aprendizagem, uso em escala das TDIC e a valorização das diferenças. São esses, segundo Schlünzen (2000), os princípios base da abordagem CCS. No entanto, para gerar uma mudança plena é preciso um trabalho colaborativo capaz de promover a inclusão em sua totalidade e, que possibilite o desenvolvimento de recursos que tornem viável mensurar e compreender a efetividade de todos esses elementos conjugados em uma abordagem. De acordo com Schlünzen (2015), a abordagem CCS é resultado de intensas pesquisas que envolvem as Tecnologias Digitais de Informação e Comunicação (TDIC) nos processos 23 de ensinar e aprender mediados por abordagens metodológicas de ensino ativas, aquelas centradas na ação dos cursistas em uma perspectiva inclusiva. Pode-se afirmar que o marco histórico da abordagem CCS se dá, primeiro, com a concepção do ambiente CCS pela Professora Dra. Elisa Tomoe Moriya Schlünzen em sua tese de doutorado (SCHLÜNZEN, 2000), na qual estabeleceu meios para novas práticas pedagógicas de professores da AACD (Associação de Assistência à Criança Deficiente) ao propor e utilizar a aprendizagem baseada em projetos como principal estratégia para criar um ambiente capaz de favorecer o processo de ensino e de aprendizagem das crianças com deficiências e as TDIC foram utilizados como recursos potencializadores para a aprendizagem dos conceitos disciplinares. Neste sentido, convém, antes, definir que o ambiente CCS: é um ambiente favorável que desperta o interesse do cursista e o motiva a explorar , a pesquisar, a descrever, a refletir a depurar as suas ideias. É aquele cujo problema nasce de um movimento na sala de aula, no qual os cursistas, junto com o professor, decidem desenvolver, com auxílio do computador, um projeto que faz parte da vivência e do contexto dos cursistas. No desenvolvimento deste projeto, os cursistas irão se deparando com os conceitos das disciplinas curriculares e o professor mediará a sua formalização para que o cursista consiga dar significado ao que está sendo aprendido. (SCHLÜNZEN, 2000, P. 82) Nesse ambiente, os cursistas construíram produtos que partiam de seus próprios contextos, a partir dos quais puderam vivenciar, pensar, criar, expressar e aprender, de forma que, sem exceções, tiveram a oportunidade de aprender de forma lúdica e significativa, ao mesmo tempo em que os conceitos das disciplinas eram formalizados e relacionados com suas vivências, ganharam na qualid