Eventos

Divulgação - Defesa Nº 261

Aluno: João Antonio da Silva Lima

Título: “A análise da evasão escolar utilizando os modelos de regressão, diagrama de Ishikawa e os modelos teóricos de evasão”

Orientadora: Roberta Andrade de Araújo Fagundes - (PPGEC)

Examinador Externo: Paulo Mello da Silva - (UFRPE)

Examinador Interno: Carlo Marcelo Revoredo da Silva - (PPGEC)

Data-hora: 21 de dezembro de 2022, às 14:30h.
Local: Presencial: Mini-Auditório, no bloco C, 2º andar – UPE/POLI


Resumo:

         A evasão dos alunos das instituições de ensino são questões que merecem atenção, principalmente nos países em desenvolvimento que foi agravado, por toda mudança econômica, política e educacional. Para investigar este processo, este trabalho tem o objetivo de apresentar uma Revisão Sistemática da Literatura (RSL) identificando as técnicas de Machine Learning (ML), especialmente os modelos de previsão, para prever a evasão escolar de estudantes do ensino médio utilizando os dados do Inep do ano de 2020 das escolas brasileiras. Como resultados foi utilizado a métrica de erro médio absoluto (EMA) entre os principais modelos utilizados, sendo: a regressão linear (EMA - 7,321462), Árvore de Decisão (EMA - 7,0665218) e regressão robusta (EMA - 6,785051), foi comprovado estatisticamente com o teste t-student. Como também, identificar as variáveis de entradas dos modelos de previsão através dos fatores e causas da evasão através do diagrama de Ishikawa e dos modelos teóricos de evasão.

Divulgação - Defesa Nº 260

Aluno: Lucas Candeia Teixeira

Título: “Detecção de ataques homográficos em páginas phishing: uma solução baseada em Redes Neurais Siamesas”

Orientador: Bruno José Torres Fernandes - (PPGEC)

Coorientador: Carlos Marcelo Revoredo da Silva - (PPGEC)

Examinador Externo: Péricles Barbosa Cunha de Miranda - (UFRPE)

Examinador Interno: Cleyton Mário de Oliveira Rodrigues - (PPGEC)

Data-hora: 23 de novembro de 2022, às 16:00h.
Local: Formato Remoto (https://meet.google.com/ofm-mvmk-vgs?hs=224)


Resumo:

         O constante crescimento no volume de crimes cibernéticos bem sucedidos expõe não só uma fragilidade dos mecanismos de proteção, como também uma substancial suscetibilidade do usuário em tornar-se vítima das ações maliciosas. Um dos mais populares mecanismos para aplicação de tais violações são as páginas phishing, que possuem alto poder de persuasão e grande capacidade de adaptação, o que permite que o ataque contorne os bloqueios empregados pelos mecanismos anti-phishing. Com essas características, phishing tornou-se um dos modelos de ataque cibernético mais popular e eficaz em todo o mundo, fazendo inúmeras vítimas e causando incalculáveis prejuízos aos mais diversos setores. Muito da efetividade de ataques phishing está em sua capacidade de iludir o usuário para convencê-lo de que está acessando um serviço genuíno. Para tal função, muitas das investidas exploram a aplicação de termos homográficos para conferir fidedignidade ao ataque. Estima-se que cerca de 70% dos golpes exploram essa característica, no entanto, os mais populares mecanismos de proteção não possuem a capacidade de investigar a presença dos termos manipulados. Além disso, existe uma grande dificuldade na elaboração de bases de dados direcionadas a termos homográficos, dificultando a construção de arquiteturas inteligentes para detecção automatizada dos ataques. Neste cenário, o estudo propõe uma abordagem autônoma, baseada em uma rede neural siamesa recorrente do tipo LSTM, capaz de identificar a presença de termos homográficos em partes da URL e conteúdo das páginas phishing. De início, foi conduzida uma busca por bases de dados compostas por páginas maliciosas que contém ataques homográficos em sua composição. Ao fim dessa etapa, não foram identificadas bases de dados com tais características. Como solução para a problemática, foi construído um gerador de termos homográficos, capaz de construir diversas variações de uma marca-alvo, permitindo a aplicação das etapas seguintes. De posse dos dados, foi possível a execução de um ciclo de experimentos, onde foi avaliada a aplicabilidade do modelo baseado em aprendizado por representação para identificação de termos homográficos. Como resultado, o modelo proposto demonstrou possuir uma alta eficiência na detecção dos termos maliciosos, alcançando uma taxa de assertividade média de mais de 99,30%. Com isso, também pode-se comprovar a eficiência no modelo de geração de variações maliciosas, que ao receber trinta termos (marca-alvo) como entrada retornou mais de 33.000 variações homográficas. Conclui-se que a proposta possui uma significativa taxa de acerto, permitindo a identificação de termos homográficos com agilidade e confiabilidade, contornando diversos obstáculos para identificação dos mesmos.

Divulgação - Defesa Nº 259

Aluno: Igor Vitor Teixeira

Título: “Predicting congenital syphilis cases: a performance evaluation of different machine learning models”

Orientadora: Patricia Takako Endo - (PPGEC)

Examinadora Externa: Carmen Simone Grilo Diniz - ( USP )

Examinador Interno: Wellington Pinheiro Santos - (PPGEC)

Data-hora: 24 de outubro de 2022, às 14:00h.
Local: Formato Remoto (https://meet.google.com/tgw-qbaz-yex)


Resumo:

         Background: Communicable diseases represent a huge economic burden for healthcare systems and for society. Sexually transmitted infections (STIs) are a concerning issue, especially in developing and underdeveloped countries, in which environmental factors and other determinants of health play a role in contributing to the fast spread. In light of this situation, machine learning techniques have been explored to assess the incidence of syphilis and contribute to the epidemiological surveillance in this scenario. Objective: The main goal of this work is to evaluate the performance of different machine learning models on predicting undesirable outcomes of congenital syphilis. Method: For that, we use clinical and sociodemographic data from pregnant women that were assisted by a social program in Pernambuco, Brazil, named Mãe Coruja Pernambucana Program (PMCP). Based on a rigorous methodology, we propose six experiments using three feature selection techniques to select the most relevant attributes, pre-process and clean the data, apply hyperparameter optimization to tune the machine learning models, and train and test models to have a fair evaluation and discussion. Results: The AdaBoost-BODS-Expert model, an Adaptive Boosting (AdaBoost) model from the Balanced with One-hot Encoding Data Set (BODS) experiment that used attributes selected by health experts, presented the best results in terms of evaluated metrics, interpretability, and acceptance by health experts from PMCP. This can give more confidence and allow adoption in daily usage to classify possible outcomes of congenital syphilis using clinical and sociodemographic data.

Banca

Pagina 10 de 44

Go to top Menu