"A melhoria das taxas de mortalidade fetal, neonatal e infantil é crucial na assistência a gestantes e neonatos. A Agenda 2030 da ONU visa um mundo melhor até 2030, destacando o Objetivo 3: vida saudável para todas as idades, com foco na redução da mortalidade materna global e infantil. Nesse contexto, o cuidado pré-natal desempenha um papel primordial ao identificar gestantes em situações de risco e permitir intervenções proativas para minimizar desfechos adversos, seja mortalidades ou morbidades. Esta proposta de tese busca desenvolver o "An iNtelligent GEstational foLlow-up System - ANGELS", um sistema inteligente de monitoramento gestacional. Este sistema utiliza modelos de machine learning para proporcionar serviços integrados em uma única plataforma, auxiliando profissionais de saúde a monitorar gestantes e a identificar precocemente potenciais complicações, resultando em intervenções mais eficazes. Os modelos de machine learning focam em predizer riscos durante o período gestacional, englobando desde riscos na gravidez, como óbito fetal, até riscos no parto, como baixo peso ao nascer ou parto prematuro, e também riscos pós-parto, como mortalidade neonatal ou sífilis congênita. O ANGELS é uma plataforma unificada que busca integrar a detecção de riscos por meio de diversos modelos de machine learning, de maneira transparente para os profissionais de saúde. A plataforma pretende atender qualquer gestante que seja acompanhada por sistemas de saúde ou programas que utilizem o ANGELS, sem aumentar os custos operacionais. Para isso, os modelos devem se basear em atributos sociodemográficos, históricos gestacionais e informações do primeiro pré-natal, denominado "versão base". Adicionalmente, a plataforma ANGELS incorpora "versões complementares" dos problemas investigados, que levam em consideração exames e informações obtidas ao longo da gestação, com o objetivo de aprimorar o desempenho dos modelos. Esta proposta de tese apresenta como resultados o desenvolvimento de um modelo de machine learning para predição de morte fetal na versão base, bem como um modelo para sífilis congênita, comparando a versão base com a versão complementar. Os resultados apresentam as dificuldades encontradas pelos modelos em encontrar padrões e auxiliar na identificação de riscos, com as f1-score e sensibilidade entre 60\% e 70\%, mas vale destacar a versão complementar de sífilis congênita que melhorou as métricas de precisão e especificidade de 60% para 95%, aproximadamente. A abordagem visa oferecer um acompanhamento mais preciso e personalizado, adaptado às necessidades individuais. Espera-se que o sistema proposto contribua para a redução da natimortalidade evitável, eleve a qualidade do cuidado materno-infantil e colabore com a concretização das metas da Agenda 2030 da ONU. Além disso, a integração dos serviços do ANGELS aos sistemas de saúde e/ou programas fortalecerá os esforços para promover o bem-estar de gestantes e crianças."
"O drift, também conhecido como deriva de conceito, é um comportamento comum em ambientes dinâmicos e pode ocorrer em diversos domínios. No contexto de séries temporais, isso não é diferente, pois uma série pode ter um conceito inicial P(a), mapeado durante o treinamento do modelo, e, em um cenário real, apresentar um conceito completamente diferente ao longo do tempo. Em séries temporais, é possível observar mudanças nos fatores geradores dos dados, o que pode fazer com que uma série que inicialmente possuía um componente autorregressivo de ordem 1 passe a exibir um comportamento significativamente distinto, com um componente autorregressivo de ordem maior. Nos últimos anos, muitas estratégias foram desenvolvidas para lidar com o problema do drift em séries temporais. Essas estratégias frequentemente envolvem a análise do erro à medida que a vida útil do modelo avança. No entanto, o desafio persiste, pois, em muitos casos, as adaptações automáticas dos modelos não são suficientes para capturar as mudanças de conceito em diferentes cenários, além de geralmente não alterarem a estrutura inicial do modelo. Neste trabalho, propomos o modelo Dynamic Lag Selection Fuzzy Time Series (DLS-FTS), uma abordagem de séries temporais fuzzy projetada para lidar com a não estacionariedade dos dados. O DLS-FTS seleciona dinamicamente o melhor lag em cada timestamp durante a aplicação do modelo, baseando-se em uma métrica de avaliação das regras fuzzy. Além disso, o modelo incorpora mecanismos de adaptação contínua, que detectam a ocorrência de drift nos dados e, quando necessário, reconstroem o conjunto de regras do modelo. Os resultados experimentais indicam que o DLS-FTS supera significativamente os métodos tradicionais de previsão de séries temporais fuzzy. O modelo demonstrou uma capacidade adaptativa superior, resultando em menores erros de previsão (RMSE e MAPE) em comparação com outras abordagens. Além disso, o DLS-FTS provou ser particularmente eficaz em cenários de alta volatilidade, onde a incerteza e as mudanças nos dados são mais acentuadas. Esses resultados confirmam a robustez e a aplicabilidade do DLS-FTS em uma ampla variedade de contextos práticos, oferecendo uma ferramenta poderosa para analistas e pesquisadores que lidam com séries temporais em ambientes dinâmicos e incertos."
"Com o avanço exponencial das redes sociais e sua riqueza em dados, tais plataformas tornaram-se ferramentas fundamentais para estudos de mineração de dados. No entanto, essa abundância de informação também tem gerado um aumento significativo no discurso de ódio, especialmente devido ao falso entendimento de anonimato promovido pelo uso de perfis falso e à utilização de emojis como estratégia para mascarar as palavras, que acabam escapando da detecção convencional. Este estudo propõe uma abordagem para enfrentar esse desafio, concentrando-se no desenvolvimento de um classificador automático de discursos xenofóbicos, com foco específico na língua portuguesa. A metodologia adotada combina o método Ensemble com as técnicas de SVM, LSTM e CNN, utilizando Word2Vec com e sem a técnica emoji2desc, para o pré-processamento dos dados. Além disso, foram utilizados esses mesmos modelos combinados com a técnica de Multi-Head Attention, também com e sem o uso do emoji2desc. Também fazem parte da proposta do ensemble, os modelos XLM-RoBERTa e BERTimbau. A abordagem quantitativa adotada neste estudo é apropriada para a realidade atual, onde ataques xenofóbicos nas mídias sociais têm aumentado, muitas vezes utilizando métodos para a propagação dessas ofensas. Destaca-se que poucos estudos interpretam os emojis como parte crucial na classificação dos textos. Portanto, esta pesquisa busca o desenvolvimento de um modelo classificador para facilitar a identificação de postagens xenofóbicas e a criação de um banco de dados destinado à avaliação dessas postagens. Como resultados, destacamos no texto que o melhor modelo no ensemble proposto foi o BERTimbau, o qual alcançou uma acurácia de 84% sem o uso do emoji2desc e 91% com o emoji2desc"