André José Ribeiro Guimarães, Ricardo Mendes Junior, Maria do Carmo Duarte Freitas
Esta pesquisa identifi ca os requisitos para cientistas de dados no Brasil em anúncios de emprego. Para analisar estes documentos, adota métodos de mineração de texto: n-grama, modelagem de tópico e agrupamento. Os resultados apontam uma concentração de vagas em São Paulo e revelam que a modalidade remota é a segunda mais ofertada. Além disso, destaca que os salários no Brasil estão abaixo da média de outros países, mesmo que as organizações procurem por profi ssionais experientes e com alto nível educacional. Quanto aos requisitos, há o predomínio de habilidades técnicas como machine learning, modelos estatísticos, python, banco de dados, dentre outras. Para as técnicas de mineração, demonstra que n-grama e o agrupamento são mais adequadas que a modelagem de tópicos.