"O acompanhamento das equipes médicas para avaliar a saúde materna e fetal, pode ser crucial para a identificação precoce de complicações de saúde, como Low Birth Weight (LBW). Doença considerada preocupação de saúde pública, ressaltando desafios socioeconômicos e a importância de intervenções precoces para a evitabilidade de morbidade e mortalidade neonatal. Com mais de 20 milhões de casos anuais globalmente, o LBW está associado a diversos riscos, impactando negativamente o desenvolvimento e a qualidade de vida dos recém-nascidos e familiares. No Brasil, dados do Sistema de Informação sobre Nascidos Vivos (SINASC) revelam que anualmente, cerca de 8% a 9% dos recém-nascidos são diagnosticados com LBW, destacando a necessidade de estratégias abrangentes e políticas de saúde para gestantes. O estudo propõe a utilização de modelos de machine learning para a predição de gestantes em risco de terem recém-nascidos com LBW, visando contribuir para a prevenção e cuidados adequados. A metodologia abordou a aplicação de cinco modelos em quatro cenários distintos, onde cada cenário incorporou variações na seleção de atributos e na abordagem de experimentos envolvendo a estratégia de remover ou permanecer com os dados duplicados após o pré-processamento. Os resultados dos modelos em todos os cenários obtiveram o desempenho de avaliação na métrica specificity acima de 0.6800, indicando que os modelos consegue identificar recém-nascidos com Normal Birth Weight (NBW), enquanto revela limitações na identificação de casos de LBW, enfatizando a necessidade de aprimoramento nessa área. Experimentos com remoção de dados duplicados mostraram desafios na generalização dos modelos, especialmente quando os modelos foram testados nos datasets mais recentes (2022), com a métrica de specificity sendo a mais afetada. A análise de importância de atributos destacou características sociodemográficas e histórico gestacional como influentes na aprendizagem dos modelos. Além disso, a distribuição de atributos nos datasets evidenciou variações após a remoção de dados duplicados, indicando impacto na generalização. O estudo fornece uma visão abrangente das capacidades e limitações dos modelos de machine learning na predição de LBW, destacando-se os modelos Adaboost e Gradient Boosting como mais robustos quando utilizados para predição de LBW em cenários de dados dinâmicos."