En la actualidad se evidencia el crecimiento de ataques phishing, este trabajo tiene objetivo desarrollar un modelo de detección de sitios web phishing, basada en machine learning y teniendo en cuenta las características de la URL, el código fuente y la inteligencia de las amenazas de los sitios web. Se utiliza un conjunto de datos de 30 características de 11055 sitios web, se entrenan modelos de Random Forest, Extra Tree y Decision Tree, siendo Random Forest el modelo elegido, se evaluó el rendimiento con datos de 2211 sitios web y obtiene un accuracy de 97.56%, que es superior en comparación con los resultados de otros modelos en trabajos previos.
Currently the growth of phishing attacks is evident, this work aims to develop a model for detecting phishing websites, based on machine learning and taking into account the characteristics of the URL, the source code and the intelligence of the threats of the websites. A data set of 30 characteristics of 11055 websites is used, Random Forest, Extra Tree and Decision Tree models are trained, Random Forest being the chosen model, performance was evaluated with data from 2211 websites and an accuracy of 97.56% is obtained, which is higher compared to the results of other models in previous works.