“Diariamente é produzido, por diferentes fontes, uma grande quantidade de dados que em sua maioria formam conjuntos de dados heterogêneos. Um recurso importante utilizado para analisar essa quantidade extensiva de dados são técnicas de aprendizado de máquina. Uma vez que, através de algumas dessas técnicas aplicadas nos dados podem ser extraídas informações relevantes. A extração de informação pode produzir conhecimentos para solucionar problemas em diferentes áreas, como saúde, educação. Uma das técnicas de aprendizado de máquina utilizadas para extração de informação é a regressão. No entanto, a análise de regressão, por exemplo regressão linear, pode não modelar de forma adequada os dados em conjuntos de dados heterogêneos, pois há um potencial diferente das variáveis independentes. Assim, uma questão relevante em regressão é como a heterogeneidade dos dados pode influenciar as relações entre as variáveis do modelo. Neste contexto, o presente trabalho tem como objetivo propor modelos combinados baseados em agrupamento e regressão no contexto de mineração de dados, de forma que os resultados obtidos e analisados ajudem a diminuir o erro de predição nos dados estudados. O desempenho do modelo proposto foi medido através do erro de predição, aplicando simulações Monte Carlo. Os resultados apontam menor erro de previsão para o modelo proposto na maioria dos casos estudados.”
“Nos últimos anos, os campos de detecção e reconhecimento de texto presenciaram um rápido progresso, partindo de técnicas utilizando características pré-definidas e manualmente extraídas, para técnicas de aprendizagem de máquina, em especial no correspondente a técnicas de Redes Neurais Convolucionais, que aprendem características de baixo e alto nível da imagem. Contudo, ainda existem desafios pendentes na aplicação de Redes Neurais Profundas para diversas aplicações de mundo real. Dessas aplicações se destacam aquelas dependentes de plataformas de hardware com sérias limitações, como robôs, drones e smartphones. Para abordar tal desafio, neste trabalho é investigado o problema de detecção e reconhecimento de texto em cenas naturais e o problema de utlização de modelos de Redes Neurais Profundas em plataformas com capacidades limitadas. Como resultado desta pesquisa foram projetados e desenvolvidos dois modelos, intitulados OctShuffleMLT e OctMLT. Os modelos fazem uso de um modelo completamente convolucional que aborda texto em cena de maneira multilíngue como base, e adapta o modelo extremamente leve da ShuffleNet para o problema em questão. A ShuffleNet é uma rede que faz uso de convoluções agrupadas direcionadas por ponto e embaralhamento de canais. Além disso, nos modelos propostos são utilizadas Convoluções Octave, para diminuir o custo computacional e aprimorar a acurácia dos modelos. As Convoluções Octave dividem a extração de canais em características de alta e baixa frequência. Um dos modelos propostos, OctMLT, realiza uma troca entre acurácia e mobilidade, substituindo as camadas da ShuffleNet por camadas Res-Net. Os modelos treinados obtém uma redução de memória de 13.16% (OctShuffleMLT) e 5.52% (OctMLT), e uma redução de FLOPS em 71,86% (OctShuffleMLT) e 48.23% (OctMLT), quando comparados ao modelo de referência. Experimentos foram realizados nas bases de imagens ICDAR 2015 e ICDAR 2017 MLT e comparados com os resultados obtidos com o modelo base. Os modelos apresentados neste trabalho se mostram capazes de produzirem resultados de detecção e reconhecimento precisos em ambas as bases, superando os resultados obtidos pelo modelo de referência.”
“A ciência possui um papel fundamental na sociedade moderna principalmente devido a sua contribuição para o crescimento econômico e desenvolvimento tecnológico. Países com grande influência econômica, como é o caso dos Estados Unidos da América (EUA), investem fortemente em ciência e tecnologia, possibilitando grandes avanços dos quais são improváveis por países que não investem com a mesma finalidade. Essa forte relação de investimento acaba se tornando mais evidente pois, atualmente, presenciamos países regredindo em seus níveis de evolução científica devido à falta de capital destinado para investimento. Dentre as várias razões para preocupação com as condições da ciência está na inadequação que a educação em STEM (Science, Technology, Engineering and Mathematics) se encontra, principalmente nas relações entre quantidade e qualidade, e desigualdade na distribuição nos níveis sociais. A realidade do Brasil é bastante preocupante, pois quando comparado a outros países desenvolvidos, este não apresenta bons indicadores de formação de STEM. Se aprofundarmos esta realidade ao estado de Pernambuco encontramos uma situação ainda mais alarmante, e.g. entre 2005 e 2015, as notas em matemática e português só aumentaram 8% e 11%, respectivamente. Ainda neste contexto, é possível apontar uma piora quando constatado uma alta demanda no setor de STEM seguido de uma baixa formação de cientistas, principalmente de qualidade. Quando busca-se mensurar a atitude de estudantes com relação a área de STEM, encontram-se uma escassez de instrumentos. Portanto, este trabalho possui como objetivo propor um modelo de análise de desempenho acadêmico de estudantes em áreas STEM, baseando-se nas atitudes e vivência do aluno, logo após entrar na universidade, buscando entender as causas de uma performance acadêmica positiva ou negativa. Para isso, foram criadas bases de dados relacionadas as disciplinas com indicadores STEM, e estas foram submetidas a análises com algoritmos de Inteligência Computacional (IC). Os algoritmos selecionados foram Árvore de Decisão, Random Forest e Regressão Logística. Os resultados obtidos são satisfatórios e dão indícios que a atitude em relação à STEM, mensurada através da escala pode refletir em um possível despenho acadêmico futuro.”