João Rafael Gonçalves Evangelista, Renato José Sassi, Dacyr Dante de Oliveira Gatto, Márcio Romero, Nityananda Portellada, Rosana Cordovil da Silva, Edquel Bueno Prado Farias
In the initial phase of the pentest, named Open Source Intelligence (OSINT), Google Hacking (GH) is executed, a practice that uses strings composed by search operators called Dorks. To improve the performance of the pentest, making it automatic, you can use Artificial Intelligence. The objective of this work was to develop and apply an Open Source Intelligence approach with Kohonen Self-Organizing Maps and Natural Language Processing in the automatic execution of Dorks to improve the performance of Google Hacking practice. The proposed approach was developed in 10 phases, including the application of Natural Language Processing in the pre-processing of Dorks and Self-Organizing Maps in the generation of 53 groupings of Dorks. The auto-run of the smallest cluster was three times faster than the manual one, and the auto-run of the largest cluster was four times faster. It was concluded that the developed approach improved the performance of GH practice.
Na fase inicial do pentest, denominada Inteligência de Fontes Abertas (Open Source Intelligence-OSINT), executa-se o Google Hacking (GH), prática que utiliza strings compostas por operadores de pesquisa chamadas Dorks. Para melhorar o desempenho do pentest, tornando-o automático, pode-se utilizar Inteligência Artificial. O objetivo deste trabalho foi desenvolver e aplicar uma abordagem de Inteligência de Fontes Abertas com Mapas Auto-Organizáveis de Kohonen e Processamento de Linguagem Natural na execução automática de Dorks para melhorar o desempenho da prática do Google Hacking. A abordagem proposta foi desenvolvida em 10 fases, inclusive com a aplicação do Processamento de Linguagem Natural no pré-processamento das Dorks e dos Mapas AutoOrganizáveis na geração de 53 agrupamentos de Dorks. A execução automática do menor agrupamento foi 3 vezes mais rápida que a manual e a execução automática do maior agrupamento foi 4 vezes mais rápida. Concluiu-se, que a abordagem desenvolvida melhorou o desempenho da prática do GH.