Events

Divulgação - Defesa Nº 210

Aluno: Gabriel Alves de Lima

Título: “Diagnóstico de deficiências cognitivas e detecção de possíveis erros de rotulação para Doença de Alzheimer usando aprendizado não supervisionado”.

Orientador: Prof. Carmelo José Albanez Bastos Filho
Coorientador: Anthony José da Cunha Carneiro Lins

Data-hora: 17/Agosto/2020 (10:00h)
Local: Escola Politécnica de Pernambuco – Formato Remoto (http://meet.google.com/whu-vxwp-vdy)


Resumo:

“O diagnóstico de deficiências cognitivas como demência e declínio cognitivo leve é desafiador, pois vários fatores estão relacionados não-linearmente a essas patologias. Assim, erros de classificação cometidos por um especialista podem se tornar mais frequentes. Neste trabalho é proposta uma técnica de classificação capaz de aprender os perfis dos pacientes de maneira não supervisionada e fornecer o valor semântico aos padrões encontrados usando a técnica Majority Voting. O objetivo é fornecer uma ferramenta robusta contra erros de classificação presentes nos dados. A técnica proposta apresenta uma acurácia média de 89,33 % e, quando comparado a uma rede neural artificial treinada de maneira supervisionada, é possível encontrar experimentalmente evidências de possíveis erros de diagnósticos em 9,14 % desse conjunto de dados. Isso mostra que essa contribuição é valiosa, pois pode indicar possíveis erros de rotulação.”

Divulgação - Defesa Nº 209

Aluno: Jessiane Mônica Silva Pereira

Título: “Seleção de atributos baseada em algoritmo dialético de otimização para classificação de lesões de mama em imagens termográficas”.

Orientador: Prof. Wellington Pinheiro dos Santos
Coorientador: Sidney Marlon Lopes de Lima

Data-hora: 14/Agosto/2020 (14:00h)
Local: Escola Politécnica de Pernambuco – Formato Remoto (https://meet.google.com/kei-utpu-jvo)


Resumo:

“O câncer de mama é a maior causa de morte entre mulheres do mundo todo. Segundo o INCA (Instituto Nacional do Câncer), a detecção e tratamento precoce são fundamentais para minimizar os efeitos dessa doença e quanto mais cedo for detectada, mais sucesso pode ter no tratamento fornecido, reduzindo as taxas de mortalidade. Desta forma, os principais aliados da detecção do câncer de mama são o autoexame, que tem baixo custo, e a mamografia, que é o principal exame utilizado para o diagnóstico em estágios iniciais do câncer de mama. No entanto, a mamografia tem algumas limitações. Essas limitações da mamografia, em paralelo com o crescente número de casos de lesões mamárias em pacientes mais jovens, ou seja, mamas mais densas, ocasiona a busca e desenvolvimento de novas técnicas para a detecção precoce de lesões mamárias. Dentre quais, evidencia-se a termografia. A termografia vem sendo estudada para verificar as possibilidades do seu uso como exame de triagem na mastologia. Apesar de ser uma técnica promissora, a interpretação de imagens de termografia é muitas vezes difícil. Assim, técnicas de reconhecimento de padrões estão sendo exploradas como uma ferramenta importante para auxiliar o diagnóstico. Ao usar algoritmos de reconhecimento de padrões, as imagens são representadas por vetores de recursos. A seleção de atributos desempenha uma tarefa essencial dentro desse processo, com objetivo de reduzir o custo computacional do sistema, mas sempre levando em conta a necessidade de se manter altas taxas de acerto, já que isto pode refletir em erros de diagnóstico da lesão mamária. Esse trabalho teve como objetivo a redução da quantidade de atributos extraídos de imagens termográficas para classificação de lesões mamária utilizando algoritmo dialético de otimização (ODM), para avaliar o desempenho do algoritmo foi utilizado as métricas acurácia, índice kappa, sensibilidade e especificidade. Os classificadores utilizados foram baseado em redes neurais artificiais, árvores de decisões e classificadores bayesianos e posteriormente comparados com os resultados obtidos com todo o conjunto de atributos. Através dos dados analisados, é notório que a técnica de seleção de atributos utilizada neste trabalho simplificou os modelos de classificação, reduzindo o custo computacional desses modelos, redução do tamanho do vetor de atributos foi de cerca de 50% e com um menor impacto nas taxas de acerto da classificação da lesão mamária, com redução de acerto em torno de 3,72%. Os valores de especificidade e sensibilidade competitivos com outros métodos presente na literatura. Assim, o método proposto é uma técnica promissora para realização de redução de atributos, no qual se obteve valores de acurácia significantes, utilizando apenas 84 dos 168 atributos, demonstrando assim a importância desta etapa para a utilização da termografia como uma técnica auxiliar ao diagnóstico do câncer de mama.”

Divulgação - Defesa Nº 208

Aluno: Arthur Flor de Sousa Neto

Título: “Towards the Natural Language Processing as Spelling Correction for Offline Handwritten Text Recognition Systems”.

Orientador: Prof. Byron Leite Dantas Bezerra
Coorientador: Alejandro Héctor Toselli Rossi

Data-hora: 30/Julho/2020 (14:00h)
Local: Escola Politécnica de Pernambuco – Formato Remoto (https://meet.google.com/oof-gaze-gde)


Resumo:

“The growing demand for portability of physical manuscripts to the digital medium makes the use of more robust and automatic mechanisms common in offline Handwritten Text Recognition(HTR) systems. However, the great diversity of application scenarios and writing variations, bring challenges to the text recognition precision and, to minimize this problem, the optical model can be used in conjunction with the language model, in which it assists in decoding text through predefined linguistic knowledge. Thus, in order to improve the results, character and word dictionaries are created from the dataset used, causing the linguistic restriction within the HTR system. In this way, this work proposes the use of spelling correction techniques for text post-processing in order to obtain better results in the final stage and eliminate the linguistic dependence between the optical model and the decoding step. In addition, an encoder-decoder neural network architecture and training methodology are also developed and presented to achieve this goal. To validate the efficiency of this new approach, we conducted an experiment using: (i) five datasets of lines of text already well known in the HTR field, including a set that corresponds to a combination of all of them (All in One); (ii) three state-of-the-art optical models; and (iii) eight spelling correction techniques within the field of Natural Language Processing, varying between traditional statistical and more recent approaches, such as neural networks. In this way, the results of the techniques combinations are presented and discussed in each dataset individually. Finally, the proposed spelling correction model with the best performance is analyzed statistically, through the metrics of an HTR system and considering all the results obtained from the combinations, reaching an average sentence correction of 65%. This means a 54% improvement over the traditional method of decoding on tested datasets. In addition, other simpler statistical techniques are also discussed, bringing relevant results in some applied scenarios.”

Page 37 of 54

Go to top Menu