Valencia, España
A pesar de la relevancia de las viviendas turísticas en el flujo global de turistas, no existen datos precisos sobre su localización y características, debido a la opacidad de las plataformas de alquiler. La información disponible proviene principalmente de la técnica de web scraping, que permite extraer datos de páginas web. Este artículo tiene como objetivo analizar las tres principales bases de datos en España que emplean esta técnica: AirDNA, Inside Airbnb e INE Experimental, complementadas con los registros de cada comunidad autónoma. Se busca conocer las metas, características y condiciones de cada base de datos, respondiendo a la pregunta central de la investigación: ¿cuáles son las características distintivas de cada base de datos que podrían influir en su selección? Se ha realizado una revisión de la literatura y una validación empírica de los datos. El análisis se centró en las ciudades y regiones españolas presentes en Inside Airbnb, dado que otras bases abarcan todo el territorio. El principal hallazgo es que la elección de la base de datos depende de las características del estudio, el presupuesto y los plazos. Además, se observan discrepancias entre las bases que utilizan web scraping y los registros autonómicos, que solo incluyen viviendas registradas. Asimismo, estas varían en función de los requisitos de cada región.
Malgrat la rellevància de les vivendes turístiques en el flux global de turistes, no existixen dades precises sobre la seua localització i característiques a causa de l'opacitat de les plataformes de lloguer. La informació disponible prové principalment de la tècnica de web scraping, que permet extraure dades de pàgines web. Este article té com a objectiu analitzar les tres principals bases de dades a Espanya que empren esta tècnica: AirDNA, Inside Airbnb i INE Experimental, complementades amb els registres de cada comunitat autònoma. Es busca conéixer les metes, característiques i condicions de cada base de dades, responent a la pregunta central de la investigació: Quines són les característiques distintives de cada base de dades que podrien influir en la seua selecció? S'ha realitzat una revisió de la literatura i una validació empírica de les dades. L'anàlisi es va centrar en les ciutats i regions espanyoles presents en Inside Airbnb, atés que altres bases abasten tot el territori. La principal troballa és que l'elecció de la base de dades depén de les característiques de l'estudi, el pressupost i els terminis. A més, s'observen discrepàncies entre les bases que utilitzen web scraping i els registres autonòmics, que només inclouen vivendes registrades. Així mateix, estes varien en funció dels requisits de cada regió.
Despite the importance of tourist housing in the global flow of tourists, there is no real data on its location and use, as well as the characteristics it presents, due to the opacity of the business of web platforms for rental housing for touristic use. Therefore, the information and data available to us come from the web scraping technique, which consists of a computer method in which a digital scraping of the information offered on a web page is performed.The main objective of this article is to analyze the three main databases in Spain that use this technique to offer data on housing for touristic use: AirDNA, Inside Airbnb and INE Experimental. Additionally, the records of each autonomous community should be considered as well. This analysis aims to know the objectives of each database, the information and characteristics it entails, as well as its conditions. In other words, it intends to answer the question that every researcher should have in mind prior to a study on tourist accommodation: What are the characteristics of each tourist accommodation database that could influence the user’s preference for one lodging over another? To this end, a comprehensive review of the relevant literature was carried out, followed by an empirical validation of the listings and information provided. This included verification of raw data, consultation of online resources, and a comprehensive textual review of the totality of available information. In order to establish a spatial framework, certain Spanish cities and regions present on the Inside Airbnb platform were selected, since the rest provide information covering the entire Spanish territory.