Rómulo Alejandro Barba López, Humberto Stanley Guerrero Herrera, Janeth Doris Salazar González
El artículo tuvo como objetivo aplicar la clasificación por clusters para agrupar los datos reportados en relación con los volúmenes de ventas y exportación reportados para las empresas en el Catálogo Central de Datos de Ecuador. Se decidió para ello el empleo del Rapidminer para poder recomendar la utilización de este paquete en posibles situaciones de clases. Se realizó el agrupamiento por clústeres empleando el algoritmo de k-medias, para 2536 empresas en relación con los datos reportados por estas en cuanto a; ventas totales, ventas nacionales, total de exportaciones netas, total de empleados, total de empleados hombres y total de empleados mujeres. Los operadores empleados y presentes en Rapidminer hicieron factible: la fácil lectura del fichero, el empleo del algoritmo de k medias y la obtención de tablas de correlaciones entre las variables señaladas. La posibilidad de representación gráfica facilitó un análisis desde multiples perspectivas.En relación con el aprendizaje de Rapidminer debe señalarse que este paquete presenta todo un conjunto de operadores que no son de fácil utilización para personal no especializado en estadística y en minería de datos. No obstante si se enfoca el aprendizaje de este en relación con aspectos específicos, como se realizó para el agrupamiento en clústeres y el establecimiento de correlaciones, si pudiera analizarse su posible aplicación en la docencia de las ciencias administrativas. A le vez las posibilidades gráficas que ofrece esta herramienta son muy atractivas para la presentación de resultados.