Phishing é um método de ataque cibernético no qual os agressores tentam ludibriar indivíduos para obter informações confidenciais, como senhas e dados financeiros, frequentemente por meio de mensagens falsas ou sites fraudulentos. No cenário dinâmico do phishing, os ataques se adaptam constantemente, a fim de evitar detecções. Soluções anti-phishing envolvem o desenvolvimento de ferramentas e técnicas para identificar, bloquear e prevenir esses ataques, muitas vezes combinando análise de características estáticas e dinâmicas para combater a evolução das ameaças. Diante desse problema, esta pesquisa teve como objetivo analisar os comportamentos temporais e dinâmicos, a fim de construir um alicerce técnico capaz de favorecer a criação ou aprimoramento de sistemas para a detecção de páginas de phishing. Para isso, a pesquisa adotou uma abordagem empírica, culminando na criação da base de dados Piracema. Através da análise de seus registros, foi possível investigar a evolução das características dinâmicas dos ataques ao longo do tempo, bem como o relacionamento entre as características e sua relevância na identificação das ameaças. A análise contemplou nove características dinâmicas específicas, e os resultados obtidos evidenciaram padrões de comportamento variados, fornecendo insights sobre a mutabilidade e a persistência dessas características. Portanto, por meio deste estudo, tornou-se possível discernir características do phishing que demonstraram diferentes níveis de impacto ao longo do tempo. Essa constatação oferece uma base valiosa para a formulação de estratégias anti-phishing mais eficazes, as quais incorporam a análise do cenário temporal e dinâmico das ameaças cibernéticas, reforçando a segurança digital em um ambiente em constante evolução.
Os avanços na tecnologia permitiram a extração de enormes quantidades de dados como tabular, texto, imagens e som. Dentre eles, dados tabulares têm sido utilizados na literatura e indústria com modelos de Machine Learning (ML), como algoritmos baseados em árvore. No entanto, existe um tipo de ML chamado Deep Learning (DL) que alcança bons desempenhos com dados como imagens, mas não é comumente utilizado com dados tabulares. Mesmo assim, o uso de DL com dados tabulares é possível convertendo os dados em imagens para treinar Redes Neurais Convolucionais (CNN). O principal objetivo desta dissertação é comparar o desempenho de modelos CNN treinados em dados tabulares de saúde convertidos em imagens por diferentes conversores, identificar o melhor conversor e comparar a CNN proposta com os modelos ML. Os conversores irão converter conjuntos de dados de saúde para treinar os modelos CNN, então fazemos uma análise comparativa. Os resultados sugerem que os modelos CNN podem ser treinados usando imagens convertidas de dados tabulares. E mesmo um modelo básico de CNN pode alcançar desempenhos próximos ao de um algoritmo de ML baseado em árvore.
"A utilização de fontes não renováveis de energia ao longo dos anos trouxe vários prejuízos para o planeta, como o aquecimento global. Um dos principais fatores que contribuem para o aquecimento global é a emissão de gases que colaboram para o efeito estufa, muitos destes emitidos pelos processos de geração de energia a partir de fontes não renováveis. Com o objetivo de combater este problema crônico, os governos têm aumentado os investimentos em fontes renováveis de energia, tais como a energia eólica. Diante deste contexto, esta pesquisa tem como objetivo a previsão da velocidade do vento (principal variável dentro do contexto de energia eólica), com o intuito de contribuir com o planejamento e distribuição desta fonte renovável de energia, bem como com a aceleração da adesão desta fonte à matriz energética tradicional. Para atingir este objetivo, um sistema híbrido baseado em seleção dinâmica de resíduos é proposto para a previsão da velocidade média do vento, considerando horizontes de tempo horários e mensais. Além da série temporal de velocidade média do vento, são utilizadas as variáveis exógenas: pressão atmosférica, precipitação e temperatura. O método proposto baseia-se na utilização combinada de um modelo de predição linear, pertencente à família ARIMA, juntamente com modelos de machine learning, tais como o MLP, SVR e RBF. O método proposto foi aplicado em bases de dados horárias e mensais referentes a 3 cidades do nordeste brasileiro: Fortaleza-CE, Natal-RN e Recife-PE. Dentre as 6 bases de dados analisadas, o método proposto obteve os melhores resultados nas bases: horária e mensal, referentes a cidade de Fortaleza; e na base de dados horária, oriunda da cidade de Natal. Estes resultados foram metrificados em termos de Mean Squared Error (MSE) e Mean Absolute Percentage Error (MAPE), com valores girando em torno de 0, 1384 e 10, 94, respectivamente, em uma das bases. Os resultados alcançados por esta pesquisa podem trazer ganhos significativos relacionados ao planejamento e distribuição de energia eólica, por trazer uma ferramenta de fácil uso e com respostas em um curto espaço de tempo sobre a previsão da velocidade do vento em janelas mensais e horárias."