Lucas Nunes Sequeira, Pedro Luiz de Paula Filho, Fabrício Correia de Oliveira, Eduardo Eyng, Jakeline da Silva Andrade
O objetivo deste trabalho foi avaliar a aplicação de Redes Adversárias Generativas (GANs) e Modelos de Difusão na geração de dados sintéticos para lidar com o desbalanceamento em conjuntos de dados de imagens, com foco específico na classificação de itens de vestuário. Utilizando um subconjunto desbalanceado do FashionMNIST, foram testadas e comparadas abordagens baseadas em DCGANs e U-Net com difusão. As imagens geradas pela U-Net com difusão apresentaram menor ruído e maior qualidade geral, conforme demonstrado pelas métricas FID e IS, que superaram as obtidas pela DCGAN. O classificador YOLOv8n, treinado com os dados expandidos, mostrou uma melhora no F1-score da classe sub-representada, evidenciando a eficácia do aumento de dados sintéticos na melhoria do desempenho de classificadores em cenários desbalanceados. Neste contexto, conclui-se que os Modelos de Difusão, especialmente a U-Net com difusão, se mostrou superior na geração de amostras sintéticas de alta qualidade, sendo uma abordagem promissora para aplicações em que o desbalanceamento de classes é um desafio.