Keli Rodrigues do Amaral Benin, Luiz Fernando Puttow Southier
, Lovania Roehrig Teixeira
, Jefferson Tales Oliva
, Marcelo Teixeira
Em sistemas de busca por obras bibliográficas é comum o uso de vocabulários controlados para indexação, os quais possuem uma terminologia padronizada e estável ao longo do tempo. No entanto, essa formalização nem sempre reflete a linguagem cotidiana dos leitores, que pode ser involuntariamente transferida para o sistema de busca pelos usuários, especialmente em ambientes digitais, o que pode limitar a recuperação da informação. Este artigo propõe uma abordagem baseada em mineração de textos que visa complementar a indexação formal de obras com termos extraídos de comentários espontâneos de leitores, coletados em plataformas online. A proposta foi aplicada ao catálogo de uma biblioteca universitária, utilizando como fonte auxiliar os comentários disponíveis no comércio eletrônico de livros da Amazon. Foram analisados comentários sobre 10 obras com volume representativo de interações. Os resultados indicam que aproximadamente 75% dos termos recomendados pela abordagem não estavam presentes na indexação original, embora estivessem semanticamente relacionados ao conteúdo das obras. A análise sugere que os termos adicionais têm potencial para enriquecer o sistema de indexação, ampliar a sua cobertura temática e fortalecer a mediação semântica entre o vocabulário informal e os descritores formais de indexação.
In bibliographic search systems, the use of controlled vocabularies for indexing is common. These vocabularies feature standardized and stable terminology over time. However, such formalization does not always reflect the everyday language of readers, which may be unintentionally transferred to the search system by users, especially in digital environments, potentially limiting information retrieval. This article proposes a text mining-based approach aimed at complementing the formal indexing of works with terms extracted from spontaneous reader comments collected on online platforms. The proposed method was applied to a university library catalog, using reader reviews from Amazon’s book marketplace as an auxiliary source. Comments on 10 works with a significant volume of interactions were analyzed. The results show that approximately 75% of the terms recommended by the approach were not present in the original indexing, although they were semantically related to the content of the works. The analysis suggests that these additional terms have the potential to enrich the indexing system, broaden its thematic coverage, and strengthen the semantic mediation between informal vocabulary and formal indexing descriptors.