Madrid, España
Aunque no todo el mundo sea consciente todos los datos disponibles en la red son útiles y tienen un gran potencial de ayuda a nuestra sociedad. La plataforma digital Twitter es una red social donde en ocasiones las personas expresan sus sentimientos y emociones, y este proyecto surge de la idea de hacer un análisis de estos datos de que se pueda realizar a través de una herramienta de Machine Learning un perfil típico un cuadro psiquiátrico de depresión, y si es posible la tendencia al suicidio asociada. La herramienta para la extracción de datos de Twitter utilizada ha sido Tweepy, y con los usuarios obtenidos con ésta y las características definidas para ellos, se ha generado una base de datos en formato excel en la nube One Drive que recoge toda esta información. A continuación, con la herramienta de Machine Learning llamada UMAP, se ha realizado un análisis de forma no supervisada de la base de datos, gracias al cuál se han podido diferenciar tres grupos, con una distancia intercluster muy baja, lo que quiere decir que cada observación se parece mucho a sus vecinos. De estos tres grupos hay uno al que se asociaría una conducta o uso de esta plataforma de una forma normal o estándar, y otros dos de diferente dimensión que cumplen parte de las características asociadas al trastorno de depresión.
Although not everyone is aware of it, data available on the Internet are very useful and have a great potential to help our society. The digital platform Twitter is a social network where people sometimes express their feelings and emotions. And this paper arises from the idea of doing an analysis of these data through a Machine Learning tool, to find a psychiatric picture of depression, and if it is possible, the associated suicidal tendency. Twitter data extraction tool has been Tweepy, and with the profile data users, it has been made, an excel database that collects the information. Next, with the Machine Learning tool called UMAP, an unsupervised analysis of the database has been carried out, thanks to which it has been possible to differentiate three groups, with a very low inter cluster distance, which suggest that each observation looks a lot like its neighbors. From these three groups, we find one which behavior or use of the platform would be associated with a normal or standard way. The two other two group of meet part of the characteristics associated with depression.