"Malaria remains one of the most critical public health concerns in Brazil, with over 99\% of national cases occurring in the Legal Amazon region. The region’s geographic vastness, low population density, and limited healthcare infrastructure pose significant challenges for traditional epidemiological surveillance. To address this, the present study proposes the development of IAra, an intelligent platform for malaria incidence forecasting and epidemic classification, integrating spatial clustering and machine learning models within a unified and accessible web system. A robust and standardized methodology was employed throughout the study, encompassing data preprocessing, feature selection, spatial and temporal segmentation, model training, hyperparameter optimization, and epidemic classification. For predictive modeling, a comprehensive suite of techniques was used: classical statistical models (ARIMA), machine learning models (Support Vector Regression, Random Forest, XGBoost), and deep learning architectures (LSTM and GRU). This diverse modeling approach enabled comparative analyses across algorithms and scenarios, enhancing the methodological rigor and generalizability of findings. The first experimental study focused on the state of Amazonas, evaluating nine scenarios combining three types of malaria segmentation (All types, \textit{P. vivax}, and \textit{P. falciparum}) with three spatial grouping strategies (entire state, health regions, and k-means-based clusters). The results demonstrated that k-means clustering consistently improved predictive performance. For instance, in the case of \textit{P. vivax}, the ARIMA model achieved an RMSE of 0.027 and MAE of 0.020 when predicting for the whole state, whereas clustering reduced RMSE to as low as 0.016 and MAE to 0.013. For \textit{P. falciparum}, LSTM outperformed other models in certain clusters, revealing its strength in modeling localized, low-incidence dynamics. The second study extended the approach to classify predicted case counts into epidemic or non-epidemic events, using historical thresholds and rule-based criteria. By incorporating the duration and intensity of predicted outbreaks, the system supports not only numerical forecasting but also actionable alerts for health authorities. Results indicated that combining spatial clustering with classification techniques enables early identification of critical epidemiological shifts, especially in regions with volatile transmission patterns. To operationalize these results, IAra was implemented as a web-based platform integrating all methodological components. The system provides an intuitive and responsive interface that allows users to upload CSV datasets, view descriptive analytics, interact with heatmaps and time-series visualizations, and receive weekly forecasts and epidemic alerts. Built with modern technologies such as Next.js (React), Streamlit, and Plotly Dash, IAra ensures cross-device compatibility and real-time processing capabilities. The platform demonstrates strong potential for adoption by public health systems, offering both strategic and operational support for malaria surveillance in the Amazon. Furthermore, the methodological framework and system architecture are designed to be adaptable to other diseases and regional contexts, contributing to broader goals of data-driven, preventative health policy in alignment with the WHO’s malaria elimination strategies and the UN 2030 Agenda."
A tomada de decisão racional é cada vez mais fundamentada em dados e, consequentemente, métodos de previsão precisam de maior poder preditivo. Uma das áreas que demanda mais essa capacidade apurada é a previsão de séries temporais. Uma forma de melhorar a previsão de séries é por meio do uso de combinações de modelos; essas vêm mostrando-se como ferramentas viáveis para aumentar a acurácia de sistemas preditivos. Esta dissertação analisa quatro operadores de combinação para previsão de séries temporais: média simples, mediana, média ponderada e stacking (empilhamento) com SVR como meta-modelo. O contexto de análise desses preditores é a previsão de um passo à frente, séries de sazonalidade mensal e combinações de nove modelos --- quatro de aprendizagem de máquina (MLP, SVR, KNN e Random Forest) e cinco estatísticos (ARIMA, ETS, Theta, CES e TBATS). As combinações são feitas sem repetição de dois a nove modelos, cada uma empregando os quatro operadores. Além disso, é proposta uma forma nova de estimação de pesos para o operador ponderado --- o vetor de feature importance do ensemble Extremely Randomized Trees. Após a análise dos combinadores, constataram-se resultados favoráveis ao operador média ponderada, com os menores erros de SMAPE e RMSE, bons resultados também para a média simples, concordando com a literatura. Os operadores mediana e empilhamento não obtiveram um apuramento satisfatório, contradizendo alguns trabalhos importantes que o utilizaram, e stacking com os resultados piores, em geral inferiores aos modelos individuais.
"A disseminação de notícias falsas (fake news) em redes sociais representa uma ameaça signifi cativa à estabilidade social e democrática, exigindo métodos de detecção cada vez mais rápidos e precisos. Enquanto as abordagens baseadas em Redes Neurais em Grafos (GNNs) são promissoras para modelar a estrutura de propagação, elas muitas vezes não capturam os sinais de anomalia presentes nos estágios iniciais de uma cascata. Esta dissertação introduz uma nova abordagem híbrida, a HybridDCAGNN, inspirada na Teoria do Perigo do sistema imunológico. Propomos uma camada convolucional em grafo customizada e treinável, a DCAConv, que aprende a gerar um “sinal de perigo” para cada nó ao analisar o fl uxo de informação direcional da propagação. Este sinal enriquece as features dos nós antes de serem processadas por um backbone GNN padrão (GCN, SAGE, GIN, CHEB). Experimentos conduzidos nos datasets GossipCop e Politifact demonstram que a abordagem híbrida é superior aos modelos baseline, especialmente na tarefa crítica de detecção precoce, onde a informação estrutural é escassa. A análise de explicabilidade confi rma que o modelo aprende a identifi car nós de “alto perigo”, validando a inspiração biológica. Concluímos que a integração de princípios da Teoria do Perigo em GNNs oferece um caminho robusto para a criação de modelos mais efi cazes e interpretáveis para o combate à desinformação."