Os avanços na tecnologia permitiram a extração de enormes quantidades de dados como tabular, texto, imagens e som. Dentre eles, dados tabulares têm sido utilizados na literatura e indústria com modelos de Machine Learning (ML), como algoritmos baseados em árvore. No entanto, existe um tipo de ML chamado Deep Learning (DL) que alcança bons desempenhos com dados como imagens, mas não é comumente utilizado com dados tabulares. Mesmo assim, o uso de DL com dados tabulares é possível convertendo os dados em imagens para treinar Redes Neurais Convolucionais (CNN). O principal objetivo desta dissertação é comparar o desempenho de modelos CNN treinados em dados tabulares de saúde convertidos em imagens por diferentes conversores, identificar o melhor conversor e comparar a CNN proposta com os modelos ML. Os conversores irão converter conjuntos de dados de saúde para treinar os modelos CNN, então fazemos uma análise comparativa. Os resultados sugerem que os modelos CNN podem ser treinados usando imagens convertidas de dados tabulares. E mesmo um modelo básico de CNN pode alcançar desempenhos próximos ao de um algoritmo de ML baseado em árvore.
"A utilização de fontes não renováveis de energia ao longo dos anos trouxe vários prejuízos para o planeta, como o aquecimento global. Um dos principais fatores que contribuem para o aquecimento global é a emissão de gases que colaboram para o efeito estufa, muitos destes emitidos pelos processos de geração de energia a partir de fontes não renováveis. Com o objetivo de combater este problema crônico, os governos têm aumentado os investimentos em fontes renováveis de energia, tais como a energia eólica. Diante deste contexto, esta pesquisa tem como objetivo a previsão da velocidade do vento (principal variável dentro do contexto de energia eólica), com o intuito de contribuir com o planejamento e distribuição desta fonte renovável de energia, bem como com a aceleração da adesão desta fonte à matriz energética tradicional. Para atingir este objetivo, um sistema híbrido baseado em seleção dinâmica de resíduos é proposto para a previsão da velocidade média do vento, considerando horizontes de tempo horários e mensais. Além da série temporal de velocidade média do vento, são utilizadas as variáveis exógenas: pressão atmosférica, precipitação e temperatura. O método proposto baseia-se na utilização combinada de um modelo de predição linear, pertencente à família ARIMA, juntamente com modelos de machine learning, tais como o MLP, SVR e RBF. O método proposto foi aplicado em bases de dados horárias e mensais referentes a 3 cidades do nordeste brasileiro: Fortaleza-CE, Natal-RN e Recife-PE. Dentre as 6 bases de dados analisadas, o método proposto obteve os melhores resultados nas bases: horária e mensal, referentes a cidade de Fortaleza; e na base de dados horária, oriunda da cidade de Natal. Estes resultados foram metrificados em termos de Mean Squared Error (MSE) e Mean Absolute Percentage Error (MAPE), com valores girando em torno de 0, 1384 e 10, 94, respectivamente, em uma das bases. Os resultados alcançados por esta pesquisa podem trazer ganhos significativos relacionados ao planejamento e distribuição de energia eólica, por trazer uma ferramenta de fácil uso e com respostas em um curto espaço de tempo sobre a previsão da velocidade do vento em janelas mensais e horárias."
Descargas parciais em cadeias de isoladores de alta tensão são uma fonte comum de problemas em redes elétricas. Elas ocorrem quando a tensão aplicada excede a capacidade dielétrica dos isoladores, causando pequenos arcos elétricos que danificam a superfície do isolador e reduzem sua eficácia. O acúmulo de poluentes nos isoladores pode aumentar a probabilidade de ocorrência de descargas parciais ou até mesmo de descargas completas, conhecidas como "flashover". Flashover é um evento de falha elétrica de alta energia que pode causar falhas no sistema, além de ser perigoso para pessoas e equipamentos próximos. O monitoramento precoce de descargas parciais permite que medidas corretivas sejam tomadas antes que ocorra um flashover, possibilitando a adoção de medidas preventivas. Neste trabalho, foi utilizado um classificador bayesiano para identificar o risco de falhas, com base no agrupamento da taxa de atividade em relação à umidade relativa. A análise foi realizada utilizando um conjunto de dados obtido por meio de uma rede de sensores instalados em estações de monitoramento ao longo de linhas de transmissão de alta tensão e foram realizados experimentos com o cruzamento de dados de diferentes estações a fim avaliar a intercambialidade entre os dados. O método testado permitiu o monitoramento do risco de ocorrência de flashover sob uma métrica padronizada que se auto ajusta ao banco de dados utilizado. Além disso, os resultados mostraram que o classificador foi capaz de identificar a evolução do estado normal até atingir o estado anômalo do isolador com antecedência e prever descargas parciais mais severas. Também ficou constatado que a rede treinada com os dados coletados em uma determinada estação de monitoramento, poderá ser utilizado em uma estação distinta através da transferência de aprendizado.