“Na área de Aprendizagem de Máquina os métodos de combinação de modelos consistem em poderosas técnicas e ganharam grande popularidade devido aos seus excelentes desempenhos de generalização. Os modelos combinados geralmente resultam em um desempenho muito melhor do que as técnicas base que os compõem. Diferentes modelos combinados no contexto de Mineração de Dados têm sido aplicados na predição de variáveis nas mais diferentes áreas de estudo utilizando técnicas de classificação e regressão. Dito isto, o presente estudo descreve as etapas de uma metodologia de Mineração de Dados para a construção de modelos combinados. Foi realizado o desenvolvimento de um modelo de regressão Stacking (ou empilhamento de modelos) de forma que os resultados obtidos e analisados ajudem a ratificar sua eficiência na predição de variáveis de conjuntos de dados reais. Técnicas de regressão paramétricas (modelos lineares) e não-paramétricas (Support Vector Regression) foram consideradas na aplicação. Para avaliar o modelo proposto criou-se um ambiente experimental, utilizando bases de dados reais e simuladas. O desempenho do modelo foi medido pelo erro de predição, aplicando simulações Monte Carlo.”
A Educação a Distância (EAD) tem se tornado cada vez mais presente no cotidiano acadêmico de alunos e professores, o que pode ser observado pelos elevados índices de crescimento registrados ao longo dos anos. Nesta modalidade de ensino, o processo de ensino e aprendizagem tem sido favorecido pela utilização de Ambientes Virtuais de Aprendizagem (AVA). Estes ambientes oferecem diversos recursos e ferramentas, capazes de promover a comunicação e entre os participantes de cursos a distância. Um destes recursos é o fórum de discussão. Neles, os estudantes podem interagir por meio de postagens de modo a contribuir para a prática do aprendizado colaborativo, trocando ideias e esclarecendo dúvidas sobre o assunto da discussão. Do ponto de vista pedagógico, através da análise dos conteúdos inseridos pelos alunos, o professor pode diagnosticar aqueles que possam estar apresentando dificuldades de aprendizado em relação a assuntos específicos. No entanto, avaliar o aprendizado dos estudantes tem se tornado uma tarefa cada vez mais desafiadora para professores e tutores, uma vez que existe um aumento no volume de dados que são registrados nestes ambientes. Neste contexto, este trabalho teve como objetivo propor a modelagem e o desenvolvimento de uma solução tecnológica que possibilite a análise de relevância temática das postagens feitas por estudantes em fóruns de discussão em ambientes de EAD, como forma de analisar o conteúdo gerado individualmente pelos participantes e avaliá-los em relação ao tema sugerido na abertura do fórum. Para isto, utilizou-se a Mineração Textual e a Ciência das Redes para o processamento e extração de características dos textos. Em seguida, as postagens processadas foram classificadas quanto a sua relevância temática, através de algoritmos de aprendizagem supervisionada. Os resultados mostram que a utilização apropriada destas técnicas podem gerar indicadores potencialmente úteis por professores e tutores na melhoria da prática pedagógica, no sentido de identificar precocemente postagens que possivelmente estejam fora do contexto da discussão."
O reconhecimento de padrões em sinais eletromiográficos (EMG) para classificação de gestos surgiu há aproximadamente 35 anos, e tem sido direcionado principalmente a sujeitos com amputações, com o objetivo de identificar as intenções de movimento para o membro faltante. O eletromiograma consiste de método experimental para gravar e avaliar uma série de sinais elétricos resultantes da condução de potenciais de ação nas fibras musculares, cujas características variam de acordo com a fisiologia, bioquímica, frequência e intensidade do estímulo. A partir das mudanças e localização que ocorrem neste sinal, é possível identificar a intenção de movimentos e como os músculos estão sendo coordenados para tal. Considerando isto, é comum aplicarem-se a estes sinais técnicas de processamento e extração de atributos para posterior classificação utilizando algoritmos de reconhecimento de padrões. Usualmente, a extração de atributos se limita à aplicação de funções que realizam mapeamentos no domínio temporal ou no domínio da frequência, com estudos escassos em outros domínios, tal como o espacial. Na perspectiva de reconhecimento de padrões, algoritmos como Máquinas de Aprendizado Extremo (ELM) têm sido utilizadas por possuírem alta velocidade de treinamento e fácil ajuste de parâmetros. Neste trabalho, apresentamos a criação de dois novos métodos, relacionados a extração e posterior classificação de atributos de sinais eletromiográficos, que denominamos Imagens Pseudo-Reconstruídas (Pseudo-Reconstructed Images – PRIMA) e a Máquina de Aprendizado Extremo Gauss-Seidel (Gauss-Seidel Extreme Learning Machine – GSELM), respectivamente. Em nossa primeira contribuição, visamos a expansão do espaço de representação do sinal mioelétrico para outra dimensão utilizando o conceito de retroprojeção a partir da decomposição dos sinais de EMG em wavelets e sua posterior projeção no plano bidimensional, utilizando a transformada de Radon. Da imagem resultante, utilizamos o método de Haralick para extração de atributos, aplicado para a representação das características de textura em imagens. Em um segundo momento, considerando a movimentação de próteses a partir destes sinais e o consequente uso de sistemas microcontrolados e suas limitações, como baixo poder de armazenamento e processamento, buscamos aprimorar a ELM para este ambiente. Para isto, criamos uma versão com treinamento iterativo, utilizando o método numérico de Gauss-Seidel, comumente utilizado para a interpolação de funções."