A malária é uma doença transmitida pela fêmea do mosquito Anopheles e pode ser tratada. No entanto, em 2019, foram relatados mais de 247 milhões de casos de malária, juntamente com 619.000 mortes. Mais de 42 milhões de brasileiros correm o risco de desenvolver malária, com 99% dos casos ocorrendo dentro ou ao redor da floresta amazônica. No Brasil, a malária ainda é um importante problema de saúde pública, apesar da queda nas ocorrências e nos óbitos. A previsão espaço-temporal precisa da transmissão da malária pode ajudar a alocar melhor os recursos para ajudar a combater a doença. Para estimar os casos de malária no estado do Amazonas, comparamos e avaliamos modelos estatísticos, deep learning e machine learning neste trabalho. Usamos clusters k-means para agrupar municípios usando um conjunto de dados brasileiro de cerca de 6 milhões de registros (janeiro de 2003 a dezembro de 2018) para testar se o desempenho dos modelos pode ser melhorado ao agrupar municípios com taxas de incidência de malária estatisticamente semelhantes. Os resultados indicam que o modelo ARIMA obteve melhor desempenho, porém, os demais modelos obtiveram valores semelhantes. A divisão dos municípios por clusters reforçou a aplicação de modelos para municípios com valores estatísticos semelhantes. Nossos experimentos mostram que todos esses modelos mostraram precisão aceitável na previsão de novos casos em clusters de k-means e regionais de saúde.
"A solda ponto é um dos processos de união de chapas metálicas mais amplamente utilizados para a construção das carrocerias e mais de 90% dos pontos de solda em todo o mundo são realizadas pela indústria automotiva. Falhas na formação dos pontos de solda podem afetar a rigidez, o desempenho de ruído e vibração do veículo em nível global, além da segurança dos passageiros, portanto, garantir a qualidade da solda ponto é de extrema importância. Respingos de solda são uma condição anômala de expulsão de material que ocorre de forma aleatória durante o processo e, uma vez que a existência de respingos pode ocasionar soldas de resistência e qualidade inadequadas, devem ser evitados. Partindo deste contexto e baseando-se em uma abordagem hipotético-dedutiva e de natureza aplicada, este projeto de pesquisa busca desenvolver modelos para detecção de anomalias, aplicando a técnica de aprendizado profundo mais utilizada para a detecção de anomalias em trabalhos recentes, identificada através de uma revisão sistemática da literatura. A pesquisa é aplicada aos dados do processo de solda ponto de uma unidade fabril automotiva que utiliza a tecnologia de solda BOSCH. O conjunto de dados, que contém parâmetros e medições do processo de solda ponto, possui muitos atributos e, por conta disso, é realizado um tratamento nos dados, visando inicialmente à redução de complexidade e redundâncias. Os níveis de respingos da base são utilizados como direcionadores para divisão dos dados em diferentes cenários, considerando maior ou menor proporção de anomalia para conduzir os experimentos e avaliar o desempenho dos algoritmos para cenários onde as anomalias são mais raras. Como os dados utilizados possuem uma rotulação específica em relação ao problema dos respingos, é considerada uma abordagem de aprendizado semi-supervisionado para identificar sua ocorrência. Após implementação de alguns modelos com diferentes arquiteturas e estratégias de ajuste de hiperparâmetros e seleção de thresholds, é realizada uma comparação destes modelos com diferentes abordagens tradicionais de classificação existentes, buscando verificar quais trazem resultados mais robustos para a tarefa de detecção das anomalias, e que melhor se adequam à natureza dos dados do processo de solda ponto, considerando diferentes métricas de avaliação."
"A avaliação de risco de crédito tem um papel fundamental para as instituições financeiras por estar associada a possíveis perdas que geram fortes impactos nos resultados financeiros. A indústria financeira necessita implementar soluções mais assertivas, rápidas e de menor custo para tarefa de avaliar bons e maus pagadores. Métodos de aprendizado de máquina (machine learning – ML) estão cada vez mais presentes e sendo utilizados por essas instituições. Além disso, o uso de técnicas de otimização de hiperparâmetros tentam melhorar o desempenho das máquinas preditivas. Neste trabalho foram aplicadas duas importantes técnicas de otimização em conjunto com seis classificadores: Regressão Logística (RL), Decision Tree (DT), Random Forest (RF), Multi Layer Perceptron (MLP), eXtreme Gradient Boost (XGBoost) e Light Gradient Boost Machine (LGBM). Os desempenhos dos classificadores foram mensurados a partir das métricas Accuracy, Precison, Recall, F1-Score, Área sobre a Curva ROC (AUC) e tempo de processamento (como uma proxy para o custo computacional). Os modelos foram treinados e testados em duas bases de crédito: German Credit e em um conjunto de dados de uma Cooperativa com atuação no Brasil. Inicialmente, foram utilizadas as configurações padrões dos hiperparâmetros dos modelos escolhidos, para, posteriormente, aplicar as técnicas de otimização Bayesiana e por Particle Swarm Optimization (PSO) com intuito de alcançar as melhores combinações de hiperparâmetros, e incrementar os primeiros resultados observados. A otimização bayesiana apresentou melhorias em todas as métricas dos modelos, com destaque para o Recall, obtendo um resultado de 91,4% no MLP. Por outro lado, a otimização por PSO não apresentou bons resultados quando comparados com os da primeira técnica de otimização. Por fim, foi aplicado um teste estatístico para comparar e validar os resultados obtidos pelos modelos.”