Eventos

Divulgação - DEFESA DE TESE DE DOUTORADO Nº 08

Aluna: Marília Nayara Clemente de Almeida Lima

Título: “Detecção e Avaliação de Desvio de Conceito Aplicadas em Dados Pontuais e Intervalares”

Orientadora: Roberta Andrade de Araújo Fagundes - (PPGEC)

Coorientador: Telmo Silva Filho - (BRISTOL)

Examinador Externo: Ricardo Bastos Cavalcante Prudencio (Cin/UFPE)

Examinadora Externa: Renata Maria Cardoso Rodrigues de Souza (Cin/UFPE)

Examinador Interno: Cleyton Mário de Oliveira Rodrigues - (PPGEC)

Data-hora: 03 de Agosto de 2023, às 09:00h.
Local:Formato Presencial - Mini Auditório (PPGEC)


Resumo:

         Contexto: em determinadas situações, os dados aos quais um modelo de aprendizado de máquina treinado é submetido são significativamente diferentes dos dados de treinamento. Isso pode causar um problema conhecido como Desvio de Conceito (DC). Há uma grande quantidade de trabalhos sobre como detectar e avaliar DC.No entanto, a maior parte se concentra em detectores que fazem uso de um modelo base. Objetivo: desenvolver um detector e uma métrica de avaliação para DC que não necessite do uso de um modelo base. O detector proposto é o Background Check for Drift Detection (BCDD) e a métrica é a Detection Distance (DD) que serão aplicados em dados pontuais e simbólicos do tipo intervalo. Visão Geral: o método de detecção proposto segue a ideia de ajustar um modelo de densidade para definir as probabilidades a posteriori e identificar se há desvio. Quanto a métrica de avaliação, verifica-se quão distante é o ponto real do desvio em relação ao ponto que o detector alertou. Metodologia: são utilizados dados sintéticos com quatro tipos diferentes de velocidade de desvio: abrupto, gradual, incremental, recorrente. Também usa-se conjunto de dados reais com desvio em proporções diferentes nas variáveis explicativas. Usou-se a configuração experimental com três modelos base: Hoeffding Tree Regressor, Hoeffding Adaptive Tree Regressor, Online Sequential Extreme Learning Machine; e sete detectores de desvio da literatura: ADWIN, DMM, EDDM, HDDM_H, HDDM_W, PH, KSWIN. Ainda são testados os modelos sempre atualizando (Partial) e nunca sendo atualizado (No_Partial). Para o processo de detecção usou-se a abordagem treine-teste-treine: (i) os modelos base são treinados com os primeiros dados (ii) nos dados de teste a cada lote é verificado se há desvio, assim: (a) se existir desvio, é alertado, retornado o status de predição e o modelo é atualizado, (b) se não existir desvio, alerta, retorna o status de predição e o lote vai para área de esquecimento. O processo (ii) é repetido até o fim dos dados de teste. Além disso, é feita uma simulação de Monte Carlo com trinta iterações. Resultados: há influência no tipo de velocidade de desvio, dispersão dos dados e modelo base utilizado. Desse modo, o BCDD se mostrou mais adequado para desvio gradual e incremental em dados intervalares. Porém, nas outras velocidades teve semelhança com o KSWIN, que teve resultados adequados, na maioria dos conjuntos de dados pontuais e intervalares analisados. Conclusão: a tese apresenta como contribuição um novo detector de DC mais adequado para dados graduais e incrementais, uma nova métrica de avaliação de DC, metodologia de experimentação do processo de detecção e uma revisão sistemática da literatura. Além do uso de dados pontuais e intervalares no contexto de regressão. Assim, os resultados contribuirão para as diferentes áreas da sociedade e pesquisas em DC.

Divulgação - Defesa Nº 07

Aluno: Ricardo Batista das Neves Junior

Título: “Segmentação de Imagens de Documentos Capturadas por Smartphones: Avaliação e Propostas de Modelos e Bases de Dados”

Orientador: Byron Leite Dantas Bezerra - (PPGEC)

Examinador Externo 1: Cleber Zanchettin (UFPE)

Examinador Externo 2: Gabriel de França Pereira e Silva (UFRPE)

Examinador Interno 1: Bruno José Torres Fernandes - (PPGEC)

Examinador Interno 2: João Fausto Lorenzato de Oliveira - (PPGEC)

Data-hora: 27 de Outubro de 2023, às 09:00h.
Local: Formato Presencial - Sala i4


Resumo:

         A Visão Computacional é uma linha de pesquisa da Inteligência Artificial que permite aos computadores processar e analisar dados visuais. Dentre os domínios de atuação da Visão Computacional, a tarefa de segmentação tem sido amplamente explorada na literatura. O emprego de algoritmos de segmentação, no contexto de processamento, análise e reconhecimento de documentos tem recebido bastante atenção na literatura, dado que existe uma ampla produção científica em torno do tema. Neste contexto, o presente trabalho apresenta três novos algoritmos. O primeiro algoritmo é apresentado como uma evolução da U-net, nomeado OctHU-PageScan, proposto para segmentação de documento e zona de texto, apresentando uma redução de tempo de processamento de até 75% e uso de 93% menos espaço em disco em comparação ao baseline. Como evolução do OctHU-PageScan, o segundo algoritmo nomeado HU-PageScan foi proposto para segmentação de documento, mostrando-se eficaz para os cenários de foto de câmera de smartphones e scanner, apresentando resultados equivalentes ao baseline reduzindo o custo computacional em mais de 50% em relação ao baseline (i.e., OctHU-PageScan). O terceiro algoritmo proposto evolui os dois primeiros, utilizando algoritmos de segmentação de imagens como um pré-processamento para realizar a tarefa de classificação de oclusão em documentos fotografados. Além dos algoritmos destacados como contribuições deste trabalho, introduzimos sete novas bases de dados voltadas para o estudo do problema de segmentação de documentos fotografados. São elas: (i) CDPhotoDataset: projetada para a segmentação de documentos de identificação inseridos em diversos backgrounds; (ii) DTDDataset: focada na segmentação de regiões de texto em documentos; (iii) Extended Smartdoc Dataset: uma extensão da base de dados original Smartdoc, elaborada para segmentar os documentos em variados backgrounds; (iv) BID-Dataset, como o primeiro conjunto de dados público brasileiro de documentos de identificação; (v) SBR-Doc Dataset, apresentado na competição ICDAR 2021, um novo conjunto de dados proposto para os desafios de segmentação de diferentes componentes do documento; (vi) Um conjunto de dados para classificação de oclusão (causada por mãos humanas) em documentos de identificação (vii) SpotBID Set: para classificação de oclusão causada pelo efeito spotlight. O desenvolvimento destas contribuições minimiza lacunas na literatura relacionadas ao desenvolvimento de algoritmos livres de template e à escassez de conjuntos de dados públicos para tarefas de processamento de documentos. Ao longo desta sequência de trabalhos publicados, cada artigo não apenas se fundamentou nos insights e descobertas do anterior, mas também buscou superar suas limitações. Esse percurso ilustra a evolução metodológica adotada e evidencia a contribuição contínua e relevante desta pesquisa.

Divulgação - Defesa Nº 284

Aluno: Gabriel Anunciação Kopte

Título: “Aprendizado por Imitação para Learning to Optimize Baseado em População: impactos em desempenho e transferibilidade"

Orientador: Fernando Buarque de Lima Neto

Corientador: Marcelo Gomes Pereira de Lacerda

Examinadora Externa: Mariana Gomes Da Motta Macedo (Université Paul Sabatier, IRIT (França)

Examinador Interno: João Fausto Lorenzato de Oliveira

Data-hora: 31 de outubro de 2023 às 10:45h.
Local: Presencial (Mar Hotel, IEEE LA-CCI 2023).


Resumo:

         Com o crescimento populacional e a escassez de recursos, é essencial otimizar seus usos para uma vida em sociedade mais sustentável. Em vários aspectos da sociedade moderna esta necessidade se mostra presente, em especial no ambiente industrial e de grandes cadeias de suprimento. Nesse cenário, surge a necessidade de novos métodos de otimização. A abordagem Learning to Optimize (L2O) simplifica o processo de desenvolvimento desses algoritmos e pode ser empregada em Aprendizado de Máquina baseados em população para efetivamente criar novos algoritmos de otimização, de forma autônoma. Os métodos de otimização baseados em população são particularmente eficazes em cenários complexos que apresentam múltiplos mínimos locais. No entanto, métodos L2O enfrentam desafios de transferibilidade e a integração do Aprendizado por Imitação ao Aprendizado por Reforço pode ser benéfica. Por isso, este estudo propõe um novo método L2O populacional que combina Aprendizado por Reforço e Aprendizado por Imitação para abordar o problema da transferibilidade. O método proposto foi comparado com o método L2O populacional utilizado como referência, e também com os já reconhecidos métodos Particle Swarm Optimization (PSO) e Adam. Os experimentos foram realizados em dois grupos: um treinando e testando os métodos na mesma função objetivo e outro treinando em uma função e testando em outra. O primeiro grupo buscou entender se o novo método supera o de referência na mesma função, enquanto o segundo analisou a transferibilidade dos algoritmos. Os resultados mostraram que, quando treinados e testados na mesma função, o método proposto não apenas superou o método de referência, mas também o PSO, demonstrando sua eficácia. O PSO destacou-se em cenários 2D, mas o novo método teve um desempenho superior em cenários 5D, sugerindo sua aptidão para problemas de maior complexidade. Além disso, foi evidenciado que o método proposto tem excelente transferibilidade, mantendo um alto desempenho mesmo quando aplicado a funções diferentes das treinadas. Desta forma, o presente estudo oferece uma contribuição significativa para o campo de Learning to Optimize e otimização em geral, apresentando um método eficaz em contextos de alta dimensionalidade e que necessitam capacidade de transferibilidade.

Pagina 9 de 53

Go to top Menu