Eventos

Divulgação - Defesa Nº 193

Aluno: Cristian Camilo Millan Arias 

Título: “Interactive Reinforcement Learning for Continuous Spaces and Dynamics Environments”.

Orientador: Prof. Bruno José Torres Fernandes

Coorientador: Francisco Javier Cruz Naranjo

Data-hora: 09/Agosto/2019 (09:00h) 
Local: Escola Politécnica de Pernambuco – SALA I-4


Resumo:

“A Aprendizagem por Reforço refere-se a um paradigma de aprendizagem de maquina onde um agente interage com um ambiente circundante para aprender como realizar uma tarefa. Muitas vezes, a aprendizagem é afetado pelas características e a forma de como o agente percebe o ambiente. As características do ambiente podem mudar sobre o tempo ou ser afetadas por perturbações externas que o agente não pode controlar. Por outro lado, as representações discretas do ambiente permitem que a aprendizagem seja rápida, e os algoritmos sejam simples para desarrolhar uma tarefa. No entanto, a informação perde-se durante o processo de discretização. Além disso, em espaços contínuos, o agente demora muito para encontras as ações ótimas. Algumas propostas resolvem esses problemas, por exemplo, a Aprendizagem por Reforço Interativo é uma abordagem no qual uma entidade externa ajuda aprender ao agente através de um feedback. Também tem abordagens robustas, como Aprendizagem por Reforço Robusto, que permite ao agente aprender uma tarefa considerando perturbações produzidas no ambiente. Nesta dissertação, propõe-se uma metodologia para implementar Aprendizagem por Reforço Interativo em cenários onde os estados e as ações estão em espaços contínuos e o ambiente é dinâmico. Para avaliar a proposta, implementou-se um cenário simples, o problema do Cart-pole, onde as características do ambiente mudam em cada episodio. Os resultados mostraram que a abordagem proposta aumenta a recompensa acumulada em relação ao método de aprendizagem autônomo, além disso, o agente é robusto contra mudanças nas características do ambiente.”

Divulgação - Defesa Nº 192

Aluno: Marília Nayara Clemente de Almeida Lima 

Título: “Modelos Combinados Baseados em Agrupamento e Regressão no Contexto de Mineração de Dados”.

Orientadora: Profª. Roberta Andrade de Araujo Fagundes
Data-hora: 05/Agosto/2019 (15:00h) 
Local: Escola Politécnica de Pernambuco – SALA I-4


Resumo:

“Diariamente é produzido, por diferentes fontes, uma grande quantidade de dados que em sua maioria formam conjuntos de dados heterogêneos. Um recurso importante utilizado para analisar essa quantidade extensiva de dados são técnicas de aprendizado de máquina. Uma vez que, através de algumas dessas técnicas aplicadas nos dados podem ser extraídas informações relevantes. A extração de informação pode produzir conhecimentos para solucionar problemas em diferentes áreas, como saúde, educação. Uma das técnicas de aprendizado de máquina utilizadas para extração de informação é a regressão. No entanto, a análise de regressão, por exemplo regressão linear, pode não modelar de forma adequada os dados em conjuntos de dados heterogêneos, pois há um potencial diferente das variáveis independentes. Assim, uma questão relevante em regressão é como a heterogeneidade dos dados pode influenciar as relações entre as variáveis do modelo. Neste contexto, o presente trabalho tem como objetivo propor modelos combinados baseados em agrupamento e regressão no contexto de mineração de dados, de forma que os resultados obtidos e analisados ajudem a diminuir o erro de predição nos dados estudados. O desempenho do modelo proposto foi medido através do erro de predição, aplicando simulações Monte Carlo. Os resultados apontam menor erro de previsão para o modelo proposto na maioria dos casos estudados.”

Divulgação - Defesa Nº 191

ATUALIZADO EM 29/07/2019

Aluno: Antonio Victor Alencar Lundgren 
Título: “OctMLT e OctShuffleMLT: modelos de Rede Neural Compactos Baseados em Convolução Octave Para Detecção e Reconhecimento de Texto em Cenas Naturais”.

Orientador: Prof. Byron Leite Dantas Bezerra
Data-hora: 30/Julho/2019 (13:00h) 
Local: Escola Politécnica de Pernambuco – SALA I-4


Resumo:

“Nos últimos anos, os campos de detecção e reconhecimento de texto presenciaram um rápido progresso, partindo de técnicas utilizando características pré-definidas e manualmente extraídas, para técnicas de aprendizagem de máquina, em especial no correspondente a técnicas de Redes Neurais Convolucionais, que aprendem características de baixo e alto nível da imagem. Contudo, ainda existem desafios pendentes na aplicação de Redes Neurais Profundas para diversas aplicações de mundo real. Dessas aplicações se destacam aquelas dependentes de plataformas de hardware com sérias limitações, como robôs, drones e smartphones. Para abordar tal desafio, neste trabalho é investigado o problema de detecção e reconhecimento de texto em cenas naturais e o problema de utlização de modelos de Redes Neurais Profundas em plataformas com capacidades limitadas. Como resultado desta pesquisa foram projetados e desenvolvidos dois modelos, intitulados OctShuffleMLT e OctMLT. Os modelos fazem uso de um modelo completamente convolucional que aborda texto em cena de maneira multilíngue como base, e adapta o modelo extremamente leve da ShuffleNet para o problema em questão. A ShuffleNet é uma rede que faz uso de convoluções agrupadas direcionadas por ponto e embaralhamento de canais. Além disso, nos modelos propostos são utilizadas Convoluções Octave, para diminuir o custo computacional e aprimorar a acurácia dos modelos. As Convoluções Octave dividem a extração de canais em características de alta e baixa frequência. Um dos modelos propostos, OctMLT, realiza uma troca entre acurácia e mobilidade, substituindo as camadas da ShuffleNet por camadas Res-Net. Os modelos treinados obtém uma redução de memória de 13.16% (OctShuffleMLT) e 5.52% (OctMLT), e uma redução de FLOPS em 71,86% (OctShuffleMLT) e 48.23% (OctMLT), quando comparados ao modelo de referência. Experimentos foram realizados nas bases de imagens ICDAR 2015 e ICDAR 2017 MLT e comparados com os resultados obtidos com o modelo base. Os modelos apresentados neste trabalho se mostram capazes de produzirem resultados de detecção e reconhecimento precisos em ambas as bases, superando os resultados obtidos pelo modelo de referência.”

Pagina 43 de 54

Go to top Menu