Events

DEFESA DE DISSERTAÇÃO DE MESTRADO Nº 308

Aluno: João Vinícius Ribeiro de Andrade

Título: “Séries Temporais Dinâmicas: Uma Abordagem Fuzzy Para Ambientes não estacionários"

Orientador: Bruno José Torres Fernandes

Coorientador: Leandro Honorato de Souza Silva

Examinador Externo 1: Hugo Valadares Siqueira - (UTFPR)

Examinador Externo 2: Sérgio Campello Oliveira

Examinador Interno: João Fausto Lorenzato de Oliveira

Data-hora: 27 de setembro de 2024, às 9h.
Local: Formato Presencial.


Resumo:

         "O drift, também conhecido como deriva de conceito, é um comportamento comum em ambientes dinâmicos e pode ocorrer em diversos domínios. No contexto de séries temporais, isso não é diferente, pois uma série pode ter um conceito inicial P(a), mapeado durante o treinamento do modelo, e, em um cenário real, apresentar um conceito completamente diferente ao longo do tempo. Em séries temporais, é possível observar mudanças nos fatores geradores dos dados, o que pode fazer com que uma série que inicialmente possuía um componente autorregressivo de ordem 1 passe a exibir um comportamento significativamente distinto, com um componente autorregressivo de ordem maior. Nos últimos anos, muitas estratégias foram desenvolvidas para lidar com o problema do drift em séries temporais. Essas estratégias frequentemente envolvem a análise do erro à medida que a vida útil do modelo avança. No entanto, o desafio persiste, pois, em muitos casos, as adaptações automáticas dos modelos não são suficientes para capturar as mudanças de conceito em diferentes cenários, além de geralmente não alterarem a estrutura inicial do modelo. Neste trabalho, propomos o modelo Dynamic Lag Selection Fuzzy Time Series (DLS-FTS), uma abordagem de séries temporais fuzzy projetada para lidar com a não estacionariedade dos dados. O DLS-FTS seleciona dinamicamente o melhor lag em cada timestamp durante a aplicação do modelo, baseando-se em uma métrica de avaliação das regras fuzzy. Além disso, o modelo incorpora mecanismos de adaptação contínua, que detectam a ocorrência de drift nos dados e, quando necessário, reconstroem o conjunto de regras do modelo. Os resultados experimentais indicam que o DLS-FTS supera significativamente os métodos tradicionais de previsão de séries temporais fuzzy. O modelo demonstrou uma capacidade adaptativa superior, resultando em menores erros de previsão (RMSE e MAPE) em comparação com outras abordagens. Além disso, o DLS-FTS provou ser particularmente eficaz em cenários de alta volatilidade, onde a incerteza e as mudanças nos dados são mais acentuadas. Esses resultados confirmam a robustez e a aplicabilidade do DLS-FTS em uma ampla variedade de contextos práticos, oferecendo uma ferramenta poderosa para analistas e pesquisadores que lidam com séries temporais em ambientes dinâmicos e incertos."

Defesa 308

DEFESA DE DISSERTAÇÃO DE MESTRADO Nº 307

Aluno: Alisson Rodrigo Santana dos Santos

Título: “Um Ensemble para a Avaliação de Emojis na Identificação de Postagens Xenofóbicas"

Orientador: Cleyton Mário de Oliveira Rodrigues

Examinador Externo: Paulo Salgado Gomes de Mattos Neto - (UFPE)

Examinador Interno: João Fausto Lorenzato de Oliveira

Data-hora: 09 de setembro de 2024, às 15h.
Local: Formato Remoto


Resumo:

         "Com o avanço exponencial das redes sociais e sua riqueza em dados, tais plataformas tornaram-se ferramentas fundamentais para estudos de mineração de dados. No entanto, essa abundância de informação também tem gerado um aumento significativo no discurso de ódio, especialmente devido ao falso entendimento de anonimato promovido pelo uso de perfis falso e à utilização de emojis como estratégia para mascarar as palavras, que acabam escapando da detecção convencional. Este estudo propõe uma abordagem para enfrentar esse desafio, concentrando-se no desenvolvimento de um classificador automático de discursos xenofóbicos, com foco específico na língua portuguesa. A metodologia adotada combina o método Ensemble com as técnicas de SVM, LSTM e CNN, utilizando Word2Vec com e sem a técnica emoji2desc, para o pré-processamento dos dados. Além disso, foram utilizados esses mesmos modelos combinados com a técnica de Multi-Head Attention, também com e sem o uso do emoji2desc. Também fazem parte da proposta do ensemble, os modelos XLM-RoBERTa e BERTimbau. A abordagem quantitativa adotada neste estudo é apropriada para a realidade atual, onde ataques xenofóbicos nas mídias sociais têm aumentado, muitas vezes utilizando métodos para a propagação dessas ofensas. Destaca-se que poucos estudos interpretam os emojis como parte crucial na classificação dos textos. Portanto, esta pesquisa busca o desenvolvimento de um modelo classificador para facilitar a identificação de postagens xenofóbicas e a criação de um banco de dados destinado à avaliação dessas postagens. Como resultados, destacamos no texto que o melhor modelo no ensemble proposto foi o BERTimbau, o qual alcançou uma acurácia de 84% sem o uso do emoji2desc e 91% com o emoji2desc"

Defesa 307

DEFESA DE DISSERTAÇÃO DE MESTRADO Nº 306

Aluno: Agostinho Antônio Freire Júnior

Título: “Além de Dados Limpos: Explorando os Efeitos de Rótulos Ruidosos no Desempenho de Detecção de Objetos”

Orientador: Bruno José Torres Fernandes

Coorientador: Leandro Honorato de Souza Silva

Examinador Externo: Tsang Ing Ren - (UFPE)

Examinador Interno: Pablo Vinicius Alves de Barros

Data-hora: 30 de Agosto de 2024, às 13h.
Local: Formato Remoto.


Resumo:

         "Nos últimos anos, a proliferação de conjuntos de dados em larga escala tem impulsionado avanços significativos em aplicações de aprendizado profundo. No entanto, a anotação desses dados continua sendo um processo intensivo em mão de obra, levando à adoção de métodos de redução de custos, como serviços de coleta de dados não especializados e a utilização de fontes de dados disponíveis na internet. Como resultado, os rótulos gerados frequentemente contêm ruídos e imprecisões, comprometendo a qualidade geral dos dados. Assim, conjuntos de dados do mundo real são conhecidos por apresentar uma taxa significativa de corrupção, desafiando a suposição tradicional de que dados limpos são necessários para modelos de aprendizado de máquina. Este trabalho investiga os efeitos do ruído nos rótulos sobre o desempenho da detecção de objetos, uma tarefa crítica em visão computacional. Realizamos uma análise abrangente da influência de rótulos ruidosos em modelos de detecção de objetos, explorando diferentes taxas de corrupção de dados e seus efeitos nos conjuntos de treinamento e validação. Para a experimentação, selecionamos três arquiteturas populares de detecção de objetos: YOLOv5, Faster R-CNN e o recente YOLOv8, utilizando três conjuntos de dados amplamente empregados na literatura: MS COCO, VOC e ExDARK. Duas métricas, Saúde do Modelo e Capacidade de Detecção, foram propostas para apoiar a análise dos resultados experimentais. Os resultados mostram que, até uma faixa de corrupção de dados de 40%, mais de 80% da Saúde do Modelo é preservada (equivalente a uma queda de 20% no mAP em relação à linha de base) em todos os conjuntos de dados para ambas as arquiteturas. No entanto, a Capacidade de Detecção, que avalia a quantidade de detecções em relação a um valor de referência, apresenta uma degradação mais rápida com o mesmo nível de corrupção. Adicionalmente, o método D-RISE foi utilizado para fornecer explicabilidade aos modelos treinados, destacando regiões nas imagens que influenciam as previsões de detecção. Notavelmente, a análise revela que as áreas relevantes para a detecção permanecem semelhantes às do modelo de linha de base até a faixa de corrupção de dados de 40%, corroborada por métricas de similaridade. Finalmente, propomos diretrizes práticas para o desenvolvimento e treinamento de modelos de detecção de objetos com pseudo-rótulos e introduzimos o método TIPR (Treinamento Incremental com Pseudo-Rótulos) como uma abordagem eficaz para mitigar o esforço manual de rotulagem, demonstrando que é possível obter modelos robustos e precisos mesmo na presença de ruído nos dados."

Defesa 306

Page 23 of 79

Go to top Menu