Eventos

Divulgação - Defesa Nº 209

Aluno: Jessiane Mônica Silva Pereira

Título: “Seleção de atributos baseada em algoritmo dialético de otimização para classificação de lesões de mama em imagens termográficas”.

Orientador: Prof. Wellington Pinheiro dos Santos
Coorientador: Sidney Marlon Lopes de Lima

Data-hora: 14/Agosto/2020 (14:00h)
Local: Escola Politécnica de Pernambuco – Formato Remoto (https://meet.google.com/kei-utpu-jvo)


Resumo:

“O câncer de mama é a maior causa de morte entre mulheres do mundo todo. Segundo o INCA (Instituto Nacional do Câncer), a detecção e tratamento precoce são fundamentais para minimizar os efeitos dessa doença e quanto mais cedo for detectada, mais sucesso pode ter no tratamento fornecido, reduzindo as taxas de mortalidade. Desta forma, os principais aliados da detecção do câncer de mama são o autoexame, que tem baixo custo, e a mamografia, que é o principal exame utilizado para o diagnóstico em estágios iniciais do câncer de mama. No entanto, a mamografia tem algumas limitações. Essas limitações da mamografia, em paralelo com o crescente número de casos de lesões mamárias em pacientes mais jovens, ou seja, mamas mais densas, ocasiona a busca e desenvolvimento de novas técnicas para a detecção precoce de lesões mamárias. Dentre quais, evidencia-se a termografia. A termografia vem sendo estudada para verificar as possibilidades do seu uso como exame de triagem na mastologia. Apesar de ser uma técnica promissora, a interpretação de imagens de termografia é muitas vezes difícil. Assim, técnicas de reconhecimento de padrões estão sendo exploradas como uma ferramenta importante para auxiliar o diagnóstico. Ao usar algoritmos de reconhecimento de padrões, as imagens são representadas por vetores de recursos. A seleção de atributos desempenha uma tarefa essencial dentro desse processo, com objetivo de reduzir o custo computacional do sistema, mas sempre levando em conta a necessidade de se manter altas taxas de acerto, já que isto pode refletir em erros de diagnóstico da lesão mamária. Esse trabalho teve como objetivo a redução da quantidade de atributos extraídos de imagens termográficas para classificação de lesões mamária utilizando algoritmo dialético de otimização (ODM), para avaliar o desempenho do algoritmo foi utilizado as métricas acurácia, índice kappa, sensibilidade e especificidade. Os classificadores utilizados foram baseado em redes neurais artificiais, árvores de decisões e classificadores bayesianos e posteriormente comparados com os resultados obtidos com todo o conjunto de atributos. Através dos dados analisados, é notório que a técnica de seleção de atributos utilizada neste trabalho simplificou os modelos de classificação, reduzindo o custo computacional desses modelos, redução do tamanho do vetor de atributos foi de cerca de 50% e com um menor impacto nas taxas de acerto da classificação da lesão mamária, com redução de acerto em torno de 3,72%. Os valores de especificidade e sensibilidade competitivos com outros métodos presente na literatura. Assim, o método proposto é uma técnica promissora para realização de redução de atributos, no qual se obteve valores de acurácia significantes, utilizando apenas 84 dos 168 atributos, demonstrando assim a importância desta etapa para a utilização da termografia como uma técnica auxiliar ao diagnóstico do câncer de mama.”

Divulgação - Defesa Nº 208

Aluno: Arthur Flor de Sousa Neto

Título: “Towards the Natural Language Processing as Spelling Correction for Offline Handwritten Text Recognition Systems”.

Orientador: Prof. Byron Leite Dantas Bezerra
Coorientador: Alejandro Héctor Toselli Rossi

Data-hora: 30/Julho/2020 (14:00h)
Local: Escola Politécnica de Pernambuco – Formato Remoto (https://meet.google.com/oof-gaze-gde)


Resumo:

“The growing demand for portability of physical manuscripts to the digital medium makes the use of more robust and automatic mechanisms common in offline Handwritten Text Recognition(HTR) systems. However, the great diversity of application scenarios and writing variations, bring challenges to the text recognition precision and, to minimize this problem, the optical model can be used in conjunction with the language model, in which it assists in decoding text through predefined linguistic knowledge. Thus, in order to improve the results, character and word dictionaries are created from the dataset used, causing the linguistic restriction within the HTR system. In this way, this work proposes the use of spelling correction techniques for text post-processing in order to obtain better results in the final stage and eliminate the linguistic dependence between the optical model and the decoding step. In addition, an encoder-decoder neural network architecture and training methodology are also developed and presented to achieve this goal. To validate the efficiency of this new approach, we conducted an experiment using: (i) five datasets of lines of text already well known in the HTR field, including a set that corresponds to a combination of all of them (All in One); (ii) three state-of-the-art optical models; and (iii) eight spelling correction techniques within the field of Natural Language Processing, varying between traditional statistical and more recent approaches, such as neural networks. In this way, the results of the techniques combinations are presented and discussed in each dataset individually. Finally, the proposed spelling correction model with the best performance is analyzed statistically, through the metrics of an HTR system and considering all the results obtained from the combinations, reaching an average sentence correction of 65%. This means a 54% improvement over the traditional method of decoding on tested datasets. In addition, other simpler statistical techniques are also discussed, bringing relevant results in some applied scenarios.”

 

Divulgação - Defesa Nº 207

Aluna: Ricardo Paranhos Pinheiro

Título: “Mecanismo de Cyber-Vigilância Baseado em Aprendizado de Máquina para Detecção de Malwares”.

Orientador: Prof. Sérgio Murilo Maciel Fernandes
Coorientador: Prof. Sidney Marlon Lopes de Lima

Data-hora:  17/Fevereiro/2020 (10:00h)
Local: Escola Politécnica de Pernambuco – Bloco K – 2º andar - Sala: I-5


Resumo:

“Este trabalho objetiva o desenvolvimento de um antivírus de próxima geração, por meio do uso de aprendizagem de máquina, reconhecimento de padrões e inteligência artificial, com o intuito de detectar Malwares PHP, JavaScript e Jar em tempo de execução. Estes tipos de arquivos foram escolhidos pois dentre todas as vulnerabilidades monitoradas na rede mundial de computadores, observa-se que a grande maioria é escrita em Java ou em JavaScript, assim como quase todos os malwares executados em servidores web são códigos PHP. Na metodologia proposta, os arquivos malwares JavaScript, Jar e PHP são executados com a finalidade de infectar de maneira intencional o Windows 7 auditado, em ambiente controlado. Deste modo, os comportamentos observados servem como atributos de entrada das máquinas de aprendizado estatístico, com o objetivo de periciar o arquivo suspeito. São monitoradas e ponderadas estatisticamente 6.824 ações dos arquivos Jar e 7.690 dos JavaScript, quando executados no Windows 7, assim como 11.777 características, em média, dos arquivos PHP, quando lançados diretamente de um servidor web malicioso para um serviço em computador. Os resultados alcançados no cenário com os arquivos JavaScript tiveram uma precisão média de 99,80% na distinção entre arquivos benignos e malwares com o uso de configurações distintas iniciais e testes de hipóteses das máquinas de aprendizado KNN, Árvore de Decisão e SVM, enquanto o cenário com os arquivos Jar apresentaram uma acurácia média de 95,61% na diferenciação entre os arquivos benignos e maliciosos com o uso de MLP. Finalmente, os scripts web PHP alcançaram uma precisão média de 97,50% ao diferenciar as amostras benignas das malignas, por meio de diferentes condições iniciais e kernels dos classificadores ELM. As diferenças nas configurações iniciais e os diferentes kernels empregados tiveram o objetivo de maximizar a precisão alcançada. O modelo aqui proposto pode vir a ajudar a suprir as limitações dos antivírus comerciais e do estado-da-arte quanto à detecção de malwares JavaScript, Jar e PHP, todos dotados de técnicas de anti-forense digital, como ofuscação, polimorfismo e ataques web sem arquivos. Ao invés de modelos baseados em listas negras, análise de eventos individuais e análise estática, aqui são utilizadas técnicas de análise dinâmica, bases autorais, aprendizagem de máquina, inteligência artificial e reconhecimento de padrões, a fim de detectar malwares de forma preventiva, e não reativa, como acontece com os antivírus comerciais.”

Pagina 46 de 63

Go to top Menu