Divulgação - Defesa Nº 268

Aluno: Marie Chantelle Cruz Medina

Título: “A Local Learning Approach for Sequential Hybrid Systems in Time Series Forecasting”

Orientador: João Fausto Lorenzato de Oliveira - (PPGEC)

Examinador Externo: Teresa Bernarda Ludermir - (UFPE)

Examinador Interno: Bruno José Torres Fernandes - (PPGEC)

Data-hora: 10 de Abril de 2023, às 10:30h.
Local: REMOTO (https://meet.google.com/aar-ajbj-ofx)

Resumo:

A aplicação de sistemas híbridos para previsão de séries temporais tem sido amplamente explorada na literatura, uma vez que oferecem melhorias significativas em desempenho e robustez em relação a modelos individuais. Um caso relevante desses sistemas é o modelo híbrido sequencial de Zhang (2003), que tem recebido diversas modificações até hoje com o objetivo de alcançar a melhor versão possível. Neste estudo, foi desenvolvida uma abordagem de seleção dinâmica baseada nos princípios de Zhang para reduzir o risco de selecionar um modelo inadequado, reduzir a variância do modelo e permitir uma melhor adaptação aos padrões exclusivos de cada série temporal. Isso foi alcançado primeiro calculando a previsão linear da série temporal e a previsão não linear de seu resíduo; logo criando de uma região de competência em torno de cada ponto de consulta a ser previsto usando os K-vizinhos mais próximos; e, finalmente, aplicando aprendizado local para combinar as previsões linear e não linear com um modelo de Regressão Kernel Ridge selecionado dinamicamente. Para testar o desempenho do modelo proposto, foram conduzidos experimentos com sete outros modelos da literatura e dez conjuntos de dados relevantes para obter medidas objetivas de desempenho e determinar o melhor. Técnicas como separação de dados de teste, normalização e ajuste de parâmetros foram implementadas para garantir a melhor combinação possível de elementos presentes, uma vez que o reconhecimento de padrões depende muito disso. Os resultados obtidos colocaram o modelo proposto como o melhor com uma classificação média de 1,50 e os menores valores de MSE em nove dos dez conjuntos de dados utilizados. Para os conjuntos de dados de Pollution, Gas, Lake Erie, Electricity, Pigs, Red Wine, Car Sales, Sunspot, Traffic e Nordic, foram obtidos valores de erro de 8,00E-05, 1,26E-04, 1,05E-03, 4,25E-04, 8,41E-03, 2,78E-04, 4,00E-04, 3,99E-03, 2,59E-04 e 1,68E-04; respectivamente. Essas medidas de erro representam um ganho de desempenho de 26,23$\%$ a 99,59$\%$ em relação a ARIMA e de 6,99$\%$ a 99,72$\%$ em relação aos outros modelos testados, com exceção de um único banco de dados em que outro modelo obteve o melhor desempenho. Para respaldar a ideia de que o modelo proposto foi o melhor em desempenho em relação a todos os outros testados, foi executado um teste de Friedman-Nemenyi, que confirmou com 95$\%$ de confiança que o desempenho do modelo proposto foi o melhor. Os resultados obtidos em todos os testes permitem concluir que as etapas sugeridas em todas as fases deste estudo representam uma contribuição na área de sistemas de previsão sequencial de séries temporais híbridas e que o desempenho obtido é relevante no estado da arte.

O Programa

Go to top

Divulgação - Defesa de Mestrado Nº 268