Angélica Félix de Castro, Leandro Carlos de Souza
O agrupamento é uma técnica conhecida na identificação de estruturas intrínsecas e na busca de informações úteis entre grandes quantidades de dados. Uma das técnicas de agrupamento mais utilizadas é o algoritmo Fuzzy C-Means. Atualmente, uma das principais preocupações do Big Data diz respeito ao tempo de processamento e acesso aos dados. É importante manter (ou melhorar) a escalabilidade dos bancos de dados. Este artigo propõe uma nova metodologia de acesso aos dados, utilizando Fuzzy C-Means e uma nova abordagem conhecida como X-μ. A união dessas duas tecnologias gerou a criação do X-μ-means, uma nova metodologia que promoveu acesso mais rápido aos dados e garantia de escalabilidade.
Clustering is a well-known technique in identifying intrinsic structures and finding useful information from amongst large amounts of data. One of the most extensively used clustering techniques is the Fuzzy C-Means algorithm. Currently one of the main concerns of Big Data concerns time processing and accessing data. It is important to maintain (or improve) the scalability of databases. This paper proposes a new methodology for accessing data, using Fuzzy C-Means and a new approach known as X-u. The union of these two technologies generated the creation of X-μ-means, a new methodology that promoted faster access to data and guaranteed scalability.