Brasil
This study investigates the increasing sophistication of deepfakes and the need to improve detection techniques. The objective is to evaluate the performance of different Deep Learning models in classifying manipulated videos, aiming for a minimum accuracy of 80%. The architectures LSTM, CNN, GRU, and CvT were analyzed, along with the application of Benford’s Law as a statistical aid. The CelebDF V2 dataset was selected for its realism and complexity. The LSTM model achieved the highest training accuracy, while GRU showed superior performance during evaluation. The CvT model underperformed in both accuracy and computational cost. Although promising, Benford’s Law yielded inconclusive results without a correlation metric. The findings highlight the importance of continually updating detection methods to keep pace with synthetic video advancements and mitigate risks linked to misinformation.
Este trabalho investiga a crescente sofisticação dos deepfakes e a necessidade de aprimorar os métodos de detecção. O objetivo é avaliar o desempenho de diferentes modelos de Deep Learning na classificação de vídeos manipulados, buscando uma acurácia mínima de 80%. Foram analisadas as arquiteturas LSTM, CNN, GRU e CvT, além da aplicação da Lei de Benford como método estatístico auxiliar. A base Celeb-DF V2 foi utilizada por sua fidelidade e complexidade. O modelo LSTM apresentou a melhor acurácia no treinamento, enquanto o GRU obteve melhor desempenho na avaliação prática. Já o CvT mostrou limitações tanto em desempenho quanto em custo computacional. A Lei de Benford mostrou-se promissora, mas inconclusiva sem um parâmetro de correlação. Os resultados reforçam a importância de atualizar continuamente os mecanismos de detecção para acompanhar a evolução dos vídeos sintéticos e mitigar riscos associados à desinformação.