Raspando a web com Java: parte 3
Nessa parte do nosso tutorial, vamos descobrir como explorar a estrutura da página Fundamentus para pegar um indicador fundamentalista. A lógica utilizada serve para todos os indicadores da página.
Para fins de teste, usaremos as ações preferenciais da empresa Petrobrás (PETR4) e o indicador P/L (Preço sobre Lucro). Uma explicação sobre esse indicador pode ser encontrado no site da Suno Research.
Vou explorar a página usando o Google Chrome. Para a maioria dos navegadores, a lógica é semelhante. A intenção é obter o seletor CSS do elemento da página que queremos extrair informações.
Clique com o botão direito sobre o valor do indicador e selecione a opção Inspecionar.

Nesse momento abrirá um novo painel com ferramentas de desenvolvedor do Chrome, chamado DevTools. O elemento que você quer extrair informações já estará selecionado na aba Elements. Agora clique novamente com o botão direito e vá até o menu Copy e selecione a opção Copy Selector, conforme a imagem.

Agora já temos o seletor CSS necessário para utilizar a API do HtmlUnit para seleção do elemento da página. A informação estará na área de transferência do SO e será assim:
body > div.center > div.conteudo.clearfix > table:nth-child(4) > tbody > tr:nth-child(2) > td:nth-child(4) > span
Na próxima parte, vamos aprender como usar HtmlUnit para pegar as informações necessárias.
Até a próxima.