Programador Feirense

Carreira, Tecnologia e Programação

Estrutura HTML

Raspando a web com Java: parte 3

3 de agosto de 2020 Tutoriais No Comments

Nessa parte do nosso tutorial, vamos descobrir como explorar a estrutura da página Fundamentus para pegar um indicador fundamentalista. A lógica utilizada serve para todos os indicadores da página.

Para fins de teste, usaremos as ações preferenciais da empresa Petrobrás (PETR4) e o indicador P/L (Preço sobre Lucro). Uma explicação sobre esse indicador pode ser encontrado no site da Suno Research.

Vou explorar a página usando o Google Chrome. Para a maioria dos navegadores, a lógica é semelhante. A intenção é obter o seletor CSS do elemento da página que queremos extrair informações.

Clique com o botão direito sobre o valor do indicador e selecione a opção Inspecionar.

Nesse momento abrirá um novo painel com ferramentas de desenvolvedor do Chrome, chamado DevTools. O elemento que você quer extrair informações já estará selecionado na aba Elements. Agora clique novamente com o botão direito e vá até o menu Copy e selecione a opção Copy Selector, conforme a imagem.

Agora já temos o seletor CSS necessário para utilizar a API do HtmlUnit para seleção do elemento da página. A informação estará na área de transferência do SO e será assim:

body > div.center > div.conteudo.clearfix > table:nth-child(4) > tbody > tr:nth-child(2) > td:nth-child(4) > span

Na próxima parte, vamos aprender como usar HtmlUnit para pegar as informações necessárias.

Até a próxima.

Javaweb scraping

Raspando a web com Java: parte 2

Raspando a web com Java: parte 4

Deixe uma resposta Cancelar resposta

Time limit is exhausted. Please reload CAPTCHA.

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

Pesquisa


Siga nas redes sociais

Blogorama - The Blog Directory

Small Acts Manifesto

Posts recentes

  • Habilitar o Linux no Chromebook
  • Review: Acer Chromebook C733
  • Eu não sou seu guru!
  • Ubuntu 20.10 está entre nós
  • Raspando a web com Java: parte 5

Arquivos

  • março 2021
  • dezembro 2020
  • outubro 2020
  • agosto 2020
  • julho 2020
  • junho 2020
  • maio 2020
  • abril 2020
  • março 2020
  • fevereiro 2020
  • janeiro 2020
  • dezembro 2019
  • outubro 2019
  • setembro 2019
  • junho 2019
  • maio 2019
  • abril 2019
  • março 2019
  • fevereiro 2019
  • janeiro 2019
  • dezembro 2018
  • setembro 2018
  • agosto 2018
  • julho 2018
  • junho 2018
  • maio 2018
  • abril 2018
  • março 2018
  • fevereiro 2018
  • janeiro 2018
  • dezembro 2017
  • novembro 2017
  • outubro 2017
  • setembro 2017
  • agosto 2017
  • julho 2017
  • junho 2017
  • maio 2017
  • abril 2017
  • março 2017
  • fevereiro 2017
  • janeiro 2017
  • dezembro 2016
  • novembro 2016
  • outubro 2016
  • setembro 2016
  • agosto 2016
  • julho 2016
  • junho 2016
  • maio 2016
  • abril 2016
  • março 2016
  • fevereiro 2016
  • janeiro 2016
  • dezembro 2015
  • novembro 2015
  • outubro 2015
  • setembro 2015
  • agosto 2015
  • julho 2015
  • junho 2015
  • maio 2015
  • abril 2015
  • março 2015
  • fevereiro 2015
  • janeiro 2015
  • dezembro 2014
  • novembro 2014
  • outubro 2014
  • setembro 2014
  • agosto 2014
  • junho 2014
  • abril 2014
  • março 2014
  • fevereiro 2014
  • janeiro 2014
  • dezembro 2013
  • novembro 2013
  • outubro 2013
  • agosto 2013
  • julho 2013
  • junho 2013
  • maio 2013
  • abril 2013
  • março 2013
  • fevereiro 2013
  • janeiro 2013
  • dezembro 2012
  • novembro 2012
  • outubro 2012
  • agosto 2011
  • junho 2011
  • maio 2011
  • abril 2011
  • março 2011
Proudly powered by WordPress | Theme: Doo by ThemeVS.