[1]
Guatemala
La disminución de la tasa de fertilidad mundial es una preocupación, ya que existe la posibilidad de que la disminución de la tasa de fertilidad mundial pueda llevar a la extinción humana. La infertilidad en hombres es un tema de interés para la salud pública, debido a la disminución de la cantidad y concentración de espermatozoides, causada por hábitos de vida, enfermedades y accidentes. La identificación de factores de riesgo en la infertilidad en hombres no es común en la medicina, pero se están desarrollando técnicas de inteligencia artificial para ayudar en la identificación de estos factores de riesgo. Este artículo se enfoca en el análisis de datos mediante minería de datos, usando la base de datos Fertility, que contiene información de 100 voluntarios. La técnica escogida para el análisis de datos fueron los árboles de decisión en MATLAB. La base de datos original tenía 9 atributos y se redujo a 5 para el modelo de clasificación. En la segunda etapa, el entrenamiento y evaluación cruzada del modelo de clasificación obtuvo un 83.3% de precisión y un tiempo de entrenamiento de 1.8774 segundos. La última etapa, una prueba con el 10% de las muestras, obtuvo un 80% de aciertos. El modelo tuvo una Tasa de Verdaderos Positivos del 94.9% para la clase N y una Tasa de Falsos Negativos del 100% para la clase O
The decrease in the worldwide fertility rate is a concern due to the potential risk of an aging population and demographic imbalances. Male infertility is a matter of interest to public health officials and researchers, as there has been a decrease in sperm count and motility caused by lifestyle habits, diseases, and accidents. The identification of risk factors in male infertility is not common in medicine, however, researchers are developing artificial intelligence techniques to identify these risk factors. This article focuses on data analysis through data mining, using the Fertility database, which contains information from 100 volunteers. The technique chosen for data analysis was decision trees, implemented in MATLAB. The original database had 9 attributes and was reduced to 5 for the classification model. During the second stage, cross-training and evaluation produced a model accuracy of 83.3% and a training time of 1.8774 seconds. In the last stage, a test with 10% of the samples obtained 80% accuracy. The model produced a True Positive Rate of 94.9% for class N and a False Negative Rate of 100% for class O.