Con el aumento del número de webs, el tiempo que un usuario invierte en la revisión de los resultados ofrecidos por los motores de búsqueda se incrementa de manera considerable. La naturaleza del contenido de estas páginas es semánticamente heterogénea y orientada al humano que sabe interpretarla correctamente. Es importante que el resultado de la búsqueda realmente corresponda a la información deseada. Una propuesta para lograrlo es comparar el contenido de la página web con el vocabulario formal del tema (ontología) y con el vocabulario informal (términos comunes del tema pero ajenos a la ontología). Se describe un tipo de búsqueda web que aprovecha las ontologías para reducir el espacio de búsqueda de ciertos temas. Con esta propuesta se mejora la relevancia de los resultados de los buscadores utilizando ontologías de dominio, el tesauro WordNet y una medida de similitud jerárquica. El aumento en la relevancia de los resultados se traduce en la disminución en el tiempo de revisión de los mismos
With the increasing number of web sites, the time spent by users reviewing the results also increases. In addition, the nature of web content is semantically heterogeneous and oriented to people who will be able to understand it.
Frequently the results from search engines do not correspond to the expected topic. One approach to improve the results is to match the content of the web pages with a formal vocabulary on the topic (ontology) and with the informal vocabulary (common terms of the topic but not in the ontology). This paper describes a web search method that takes advantage of ontologies to reduce the search area of certain topics. With this approach the relevance of search engine results is enhanced by filtering the content through the integration of domain ontologies, the WordNet thesaurus, and a hierarchical similarity measure. Thus, the improvement on the relevance of results reduces the time required to review such results.