Eventos

DEFESA DE TESE DE DOUTORADO Nº 13

Aluno: Maicon Herverton Lino Ferreira da Silva Barros

Título: “Machine-learning for classification of the prognosis of tuberculosis using real data from Brazil”

Orientadora: Patricia Takako Endo - (PPGEC)

Coorientador: Vanderson Souza Sampaio - (UFPE)

Examinadora Externa: Gisely Cardoso de Melo (UFAM)

Examinadora Externa: Danielle Moura - (UPE/FENSG)

Examinador Interno: Dimas Cassimiro - (PPGEC)

Examinador Interno: Cleyton Rodrigues - (PPGEC)

Data-hora: 21 de fevereiro de 2024, às 14:00h.
Local:Formato Remoto e Presencial.


Resumo:

         Tuberculosis (TB), for many years until the advent of COVID-19, was the leading cause of death by an infectious agent worldwide. Despite efforts by the World Health Organization (WHO) to reduce the incidence of tuberculosis, it is estimated that in 2021, about 10.6 million people fell ill with the disease and 1.6 million deaths were recorded globally. In Brazil, one person contracts tuberculosis every five minutes and one dies every hour from the disease; in 2020 alone, there was an increase of 12% in the number of deaths compared to 2019. Monitoring the possible outcomes of a patient with tuberculosis is an important task that can help reduce early mortality in a patient diagnosed with this disease. However, determining this outcome is not a trivial task, especially in terms of anticipating the patient’s prognosis. For decades, the state of health and quality of life during the treatment of a disease have been receiving increasing attention in the health field. Brazil has the Information System for Notifiable Diseases (SINAN), which contains a database with records of patients with compulsory notification diseases, including tuberculosis. Classifying the outcome of tuberculosis treatment into categories of cure and death (prognosis) using a tool that employs a machine learning model, can assist health professionals in making decisions about the most appropriate treatment, given the individual conditions of the patient and the likely course of the disease based on medical experience. Depending on the prognosis, late or inadequate treatment can result in unsatisfactory outcomes, including exacerbation of clinical symptoms, poor quality of life, and increased risk of death. In this thesis, we propose the development of a tool named TITO that uses artificial intelligence (AI) to assist in the prognosis of tuberculosis. The tool has four modules: decision support; application; interface; ongoing monitoring. Regarding the decision support module, preprocessing of SINAN data from 2001 to April 2020 was carried out, with about 1.7 million patients containing clinical, laboratory, and sociodemographic data of patients who were treated for pulmonary and extrapulmonary tuberculosis, in addition to the application of machine learning techniques, feature selection, and random search to find hyperparameter optimization. Through a rigorous scientific methodology, experiments were conducted with different scenarios of data balancing and imbalancing, using appropriate metrics to evaluate the models with the objective of selecting the artificial intelligence model with the best performance for TITO. The application module consists of a computer program, developed in Python, that runs on a web application server. The program uses the trained AI model to perform classifications of tuberculosis prognosis; it performs interpretability through the XAI technique and controls data entry for the follow-up module. The interface module, responsible for data entry, is responsible for sending the information received from the user to the application module and also for retrieving the classification history from the follow-up module. The follow-up module for monitoring the prognosis over time is responsible for recording and monitoring the prognosis and probabilities of cure or death to maintain a history of predictions over time. Promising results were found with the use of machine learning models. In the usability evaluation, TITO achieved an 83.95% score. Finally, TITO will allow health vii professionals to monitor patients’ prognosis classifications, making decision-making supported by a tool using artificial intelligence.

DEFESA DE DISSERTAÇÃO DE MESTRADO Nº 290

Aluno: João Crisanto Souto Maior

Título: “Optimizing Industrial Operations through a tailored Digital Twin system for Real-time Sensor Data Processing and Forecasting"

Orientador: Byron Leite Dantas Bezerra - (PPGEC)

Coorientador: Cleber Zanchettin - (UFPE)

Examinador Externo: Rômulo César Dias de Andrade (UPE - Caruaru)

Examinador Interno: João Fausto Lorenzato de Oliveira - (PPGEC)

Data-hora: 16 de Fevereiro de 2024, às 10:00h.
Local: Formato Presencial, com transmissão.


Resumo:

         "A solda ponto é um dos processos de união de chapas metálicas mais amplamente utilizados para a construção das carrocerias e mais de 90% dos pontos de solda em todo o mundo são realizadas pela indústria automotiva. Falhas na formação dos pontos de solda podem afetar a rigidez, o desempenho de ruído e vibração do veículo em nível global, além da segurança dos passageiros, portanto, garantir a qualidade da solda ponto é de extrema importância. Respingos de solda são uma condição anômala de expulsão de material que ocorre de forma aleatória durante o processo e, uma vez que a existência de respingos pode ocasionar soldas de resistência e qualidade inadequadas, devem ser evitados. Partindo deste contexto e baseando-se em uma abordagem hipotético-dedutiva e de natureza aplicada, este projeto de pesquisa busca desenvolver modelos para detecção de anomalias, aplicando a técnica de aprendizado profundo mais utilizada para a detecção de anomalias em trabalhos recentes, identificada através de uma revisão sistemática da literatura. A pesquisa é aplicada aos dados do processo de solda ponto de uma unidade fabril automotiva que utiliza a tecnologia de solda BOSCH. O conjunto de dados, que contém parâmetros e medições do processo de solda ponto, possui muitos atributos e, por conta disso, é realizado um tratamento nos dados, visando inicialmente à redução de complexidade e redundâncias. Os níveis de respingos da base são utilizados como direcionadores para divisão dos dados em diferentes cenários, considerando maior ou menor proporção de anomalia para conduzir os experimentos e avaliar o desempenho dos algoritmos para cenários onde as anomalias são mais raras. Como os dados utilizados possuem uma rotulação específica em relação ao problema dos respingos, é considerada uma abordagem de aprendizado semi-supervisionado para identificar sua ocorrência. Após implementação de alguns modelos com diferentes arquiteturas e estratégias de ajuste de hiperparâmetros e seleção de thresholds, é realizada uma comparação destes modelos com diferentes abordagens tradicionais de classificação existentes, buscando verificar quais trazem resultados mais robustos para a tarefa de detecção das anomalias, e que melhor se adequam à natureza dos dados do processo de solda ponto, considerando diferentes métricas de avaliação."

Defesa 290

DEFESA DE DISSERTAÇÃO DE MESTRADO Nº 289

Aluno: Gabriel Mac’Hamilton Renaux Alves

Título: “Desenvolvimento de um Mecanismo de Ingestão de Dados Independente de Contextos para AutoML"

Orientador: Alexandre Magno Andrade Maciel - (PPGEC)

Examinador Externo: Robson do Nascimento Fidalgo - (UFPE)

Examinador Interno: Carlo Marcelo Revoredo da Silva - (PPGEC)

Data-hora: 07 de Fevereiro de 2024, às 14:00h.
Local: Presencial - LIP 6.


Resumo:

         Aprendizado de máquina automatizado (sigla do inglês: AutoML) é uma das tecnologias desenvolvidas para tratar das demandas complexas relativas ao processamento e análise de dados para tomada de decisões estratégicas. Sistemas de AutoML permitem ao usuário realizar tarefas de aprendizado de máquina de forma automatizada, trazendo uma maior simplicidade para estas atividades. Uma etapa chave no processo de AutoML é a ingestão de dados, que envolve a coleta e transporte de dados externos para o fluxo de aprendizado de máquina. Porém, apesar de muitos sistemas de AutoML possuírem módulos para a entrada de dados, a falta da ingestão de dados de forma simplificada pode trazer diversas limitações no acesso a informações relevantes para os processos de análise. O presente trabalho tem como principal objetivo o desenvolvimento de um mecanismo de ingestão de dados, para a redução da complexidade e aumento da eficiência nesta etapa em sistemas de AutoML. O mecanismo desenvolvido será integrado em uma solução já existente, o Framework de Mineração de Dados Educacionais (FMDEV), desta forma permitindo que possam ser realizados testes em cenário real, avaliações de usabilidade com usuários e elicitação da opinião de especialistas, fornecendo um estudo de caso para validar o desenvolvimento do projeto. Podem ser elencados como os principais benefícios desta implementação a democratização do acesso à análise de dados, maior flexibilidade de entradas de dados e a coleta e carga de dados feita de forma otimizada e padronizada.

Defesa 289

Pagina 15 de 63

Go to top Menu