Divulgação - Defesa Nº 249

Aluna: Laila Barros Campos

Título: “Modelos de estimativa de afinidade de proteínas para projeto inteligente de fármacos”

Orientador: Wellington Pinheiro dos Santos - (PPGEC)

Examinador Externo: Giselle Machado M. Moreno - (USP)

Examinador Interno: Sidney Marlon Lopes de Lima - (PPGEC)

Data-hora: 22/Junho/2022 (14:00h)
Local: Formato Remoto (https://meet.google.com/kyz-ioyc-jcb)


Resumo:

As proteínas são objetos de estudo importantíssimos no âmbito das pesquisas biomédicas, uma vez que podem ter papel principal na descoberta de medicamentos e em diagnósticos de doenças. Esses compostos dificilmente atuam isoladamente enquanto desempenham suas funções, sendo assim muito comum formarem compostos entre si e os estudos das afinidades entre essas proteínas são bastante influentes nas descobertas e produções de novos fármacos antivirais e de vacinas. O objetivo principal desse projeto consiste em contribuir nesses estudos de afinidades entre proteínas propondo uma arquitetura profunda híbrida baseada em rede pseudo-convolucional para descrição de complexos de proteínas em imagens, rede neural convolucional para extração de características e regressores para estimar o grau de afinidade entre proteínas em um complexo. A etapa de pseudo-convolução extrai as sequências de RNA das proteínas de cada complexo, gerando duas matrizes de co-ocorrência que são posteriormente concatenadas. Essas matrizes então passam pelo processo de extração de atributos através de uma rede neural convolucional VGG19. Esses atributos passam a ser os dados de entrada para os treinamentos dos modelos de regressão que irão exercer a função de predição de afinidade entre as proteínas dos complexos. Dentre os quatro regressores treinados sendo estes o de Regressão Linear, Random Forest, Máquina de Vetor de Suporte (SVM - Support Vector Machine) e Multilayer Perceptron (MLP), os melhores resultados foram os de Random Forest e SVM. A melhor configuração do Random Forest foi a de 300 árvores, obtendo as melhores médias dos coeficientes de correlação Spearman (0,7067) e Kendall (0,5216) entre os dados preditos e os reais. A configuração do SVM com função kernel RBF, C = 0,1, g = 0,01 apresentou a melhor média do coeficiente de Pearson (0,6645) e a configuração desse mesmo regressor com função kernel RBF, C = 1,0 e g = 0,01 obteve o melhor RMSE (2,1383). É importante observar também a consistência dos resultados desses regressores, pois apresentaram baixos desvios padrão desses coeficientes.

Go to top Menú