"Esta tese propõe uma metodologia para a inclusão eficaz de variáveis exógenas em modelos de previsão de séries temporais financeiras, utilizando uma base de dados própria e amplamente acessível à comunidade científica. O objetivo central é melhorar a precisão das previsões financeiras por meio da integração de variáveis exógenas já quantificadas e compatíveis com a granularidade dos dados financeiros estudados. A pesquisa se concentra no uso de técnicas de modelagem consolidadas, como o ARIMA, testando a eficácia dessas variáveis na melhoria das previsões com base em métricas amplamente aceitas na literatura. A proposta oferece uma contribuição prática replicável, garantindo robustez e validade em ambientes controlados. A pesquisa não inclui métodos para tratar variáveis com diferentes granularidades ou dados faltantes, focando-se em variáveis exógenas que estejam totalmente alinhadas temporalmente com a série em estudo. O foco está em maximizar o potencial das técnicas já existentes, sem o desenvolvimento de novos modelos, por meio da inclusão estratégica de variáveis exógenas bem estruturadas e relevantes. A metodologia abrange desde a coleta e pré-processamento dos dados até a otimização da seleção de parâmetros via computação evolucionária, permitindo uma configuração ideal para cada série. Os testes realizados confirmaram que a inclusão de variáveis exógenas melhora a acurácia das previsões, validando a eficácia dessa abordagem para a modelagem de séries financeiras. A pesquisa, portanto, oferece uma solução prática para a integração de variáveis exógenas em previsões financeiras, com ganhos substanciais na precisão sem a necessidade de criar novos modelos."
"Malware são responsáveis por prejuízos na casa de bilhões de dólares, todos os anos, em sistemas computacionais. As ameaças que se aproveitam de vulnerabilidades ainda desconhecidas, portanto ainda não sanadas pelos pesquisadores da área de segurança, são conhecidas como Zero Day, e normalmente costuma-se transcorrer semanas, até que uma correção seja desenvolvida. Durante este período, o Zero Day pode causar perdas bilionárias. Assim, é imprescindível que sejam desenvolvidas novas técnicas que busquem a diminuição do período de identificação, e posterior correção dos Zero Day. Esta tese descreve um método para detecção de cyber-ataques Zero Day, utilizando morphological Extreme Learning Machines (mELM). Esta técnica pode ser integrada a um antivírus de próxima geração (next Generation antivirus, ou NGAV), e utiliza Inteligência Artificial para a identificação de Botnets compiladas na arquitetura RISC-V. Esta arquitetura é projetada para ser usada na Internet das Coisas (Internet of Things, ou IoT), que ainda não possui antivírus, ou sequer denúncia formal de malware. Desta forma, todo malware nesta arquitetura é inédito. Nesta metodologia, 1100 arquivos das classes benignos e malware Zero Day são executados em um ambiente emulado, a fim de que os comportamentos observados possam servir como atributos de entrada das máquinas de aprendizado estatístico. Desta maneira, os arquivos são analisados um a um, resultando em um output composto por 1054 características de cada um dos arquivos observados. A partir da avaliação destas características, os arquivos são então classificados como pertencentes ao conjunto dos benignos, ou à classe dos malware. Os resultados alcançados apresentaram uma acurácia média de 99,45% na diferenciação entre essas duas classes, a dos benignos e dos malware. Foram usadas morphological Extreme Learning Machines com Kernels autorais e parâmetros – como neurônios na camada escondida e pesos – variados. Estas configurações têm a pretensão de maximizar os resultados alcançados. Trabalhos do Estado-da-Arte foram usados para comparação do desempenho e do tempo de execução da técnica apresentada, sendo os parâmetros observados também comparados aos deste trabalho. Os resultados encontrados nesta tese também foram comparados com os percentuais de reconhecimento desta mesma família de malware Zero Day, agora apresentados a antivírus comerciais. Neste cenário, o melhor desempenho entre os antivírus comerciais obteve 24% de identificação das ameaças. As bases autorais utilizadas nesta tese estão disponíveis online, a fim de possibilitar a reprodutibilidade das técnicas descritas por outros pesquisadores. As técnicas presentes nesta tese detectam os malware de forma preventiva, não reativa, utilizando análise dinâmica, método preferencial no combate as ameaças Zero Day, uma vez que o uso de outras técnicas traria um acréscimo de tempo indesejável ao processo de reconhecimento das ameaças virtuais."
"The 2030 Agenda is a global plan by the United Nations Organization to achieve a better world for all people and nations by 2030. This Agenda proposed 17 Sustainable Development Goals (SDGs), including SDG 3 "Good Health and Well-being", which aims to end epidemics of AIDS, tuberculosis, malaria, and neglected tropical diseases (NTDs), as well as combat hepatitis, water-borne diseases, and other communicable diseases. Among the NTDs, there are arboviruses, which cause a wide range of diseases, the most common of which are Dengue, Chikungunya, and Zika. These arboviruses are transmitted by mosquitoes, such as Aedes aegypti and Aedes albopictus. Due to factors such as climate change, deforestation, population migration, and precarious sanitary conditions, the arboviruses transmitted by these mosquitoes have become a global health problem. Another critical aspect of these arboviruses is their clinical presentation. Despite being well-established diseases, they are difficult to diagnose. Most infections are asymptomatic, which means that arboviruses can be present in an area without causing outbreaks. Their symptomatic infections are typically clinically indistinguishable. Common symptoms include fever, arthralgia, myalgia, headache, and retro-orbital pain. Early detection of specific arbovirus infections can have a significant impact on the clinical course, treatment, and care decisions. In this regard, scalable and low-cost implementation strategies are required to aid in the differential diagnosis of these diseases. One such strategy is the development of computational models to assist in diagnosis based on clinical data and symptoms. In this thesis proposal, we present an application focused on the development of a model that aids in the classification of these arboviruses using only clinical data from patients. To build the models, machine learning techniques (Random Forest, Adaboost, Gradient Boosting, XGBoost, KNN, Naive Bayes) were employed, along with feature selection and hyperparameter optimization. Explainable AI (XAI) was utilized to enhance the model's interpretability. To address the diagnostic challenges, we continuously train and evaluate the proposed machine learning models using newly collected clinical data from the Sistema de Informação de Agravos de Notificação (SINAN), which is validated by healthcare professionals, in order to improve the model in production regularly."