“A seleção de dados para realizar projetos em Mineração de Dados Educacionais(EDM) é uma das etapas mais importantes e pode ser a mais complexa e cara de um projeto. Na técnica Model-Driven Development(MDD), encontramos uma alternativa para abstrair a complexidade desta etapa e, consequentemente, uma alternativa para que usuários com pouco conhecimento tecnológico também possam realizar suas análises educacionais. Neste trabalho, propomos uma linguagem de modelagem que irá, com base num metamodelo, compor uma arquitetura de referência para dar suporte ao desenvolvimento desse processo de seleção de dados. Esta linguagem, mais do que permitir construir o processo utilizando notações gráficas, ela foi de desenvolvida para abstrair dificuldades quanto a heterogeneidade de formato dos dados, realizara unificação de conjunto de dados e considerar o uso da catalogação do conhecimento. Visando mostrar a viabilidade da linguagem proposta, um protótipo para editar modelos é desenvolvido como prova de conceito. Além disso, de modo a apresentar evidências que o trabalho proposto avança o estado da arte, são especificados cenários de uso que exploram as principais necessidades para se fazer a seleção de dados e, a partir desses cenários, o trabalho proposto é comparado com os principais trabalhos relacionados. Como resultado das análises comparativas, pode-se constatar que o trabalho proposto tem as seguintes vantagens: metamodelo expressivo e notação gráfica simplificada, eficaz cognitivamente e representativa.”