Programador Feirense

Carreira, Tecnologia e Programação

Estrutura HTML

Raspando a web com Java: parte 2

27 de julho de 2020 Tutoriais No Comments

Chegamos na parte 2 do nosso tutorial de web scraping com Java. Nessa parte, vamos ver como criar um novo projeto Maven e adicionar as dependências.

Criando projeto Maven

Depois de abrir o Eclipse, vá no menu File / New / Other.

menu novo projeto Eclipse

Dentre as opções, selecione Maven Project.

Novo projeto Maven

Selecione a pasta onde o projeto será criado e marque a opção Create a simple project.

Defina as informações do projeto seguindo as opções da tela.

Dependências

Há duas formas de adicionar dependências no projeto: gráfica e editando o arquivo pom.xml.

Gráfica

Clique com o botão direito no projeto, vá até o menu Maven e selecione a opção Add Dependency.

Na janela de dependência, adicione as seguintes informações para o Apache Commons CSV:

  • Group Id: org.apache.commons
  • Artifact Id: commons-csv
  • Version: 1.8

O restante, deixe no padrão.

Para adicionar o HtmlUnit, o processo é o mesmo. Use as seguintes informações:

  • Group Id: net.sourceforge.htmlunit
  • Artifact Id: htmlunit
  • Version: 2.41.0

O restante, deixe como vem.

Editar pom.xml

Vá até o seu projeto e procure o arquivo pom.xml, dê dois cliques para abrir o arquivo e vá até a aba pom.xml conforme a imagem.

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>
  <groupId>br.com.programadorfeirense.java-scraping</groupId>
  <artifactId>java-scraping</artifactId>
  <version>0.0.1-SNAPSHOT</version>
  <name>Java Scraping</name>
  <description>Java Scraping App</description>
  <dependencies>
  	<dependency>
  		<groupId>net.sourceforge.htmlunit</groupId>
  		<artifactId>htmlunit</artifactId>
  		<version>2.41.0</version>
  	</dependency>
  	<dependency>
  		<groupId>org.apache.commons</groupId>
  		<artifactId>commons-csv</artifactId>
  		<version>1.8</version>
  	</dependency>
  </dependencies>
</project>

Se tudo estiver certo, depois de salvar, as dependências começarão a ser baixadas para o seu projeto.

Na próxima parte, veremos a estrutura da página Fundamentus usando o navegador em modo desenvolvedor para inspecionar a página.

Até a próxima.

Javaweb scraping

Raspando a web com Java: parte 1

Raspando a web com Java: parte 3

Deixe uma resposta Cancelar resposta

Time limit is exhausted. Please reload CAPTCHA.

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

Pesquisa


Siga nas redes sociais

Blogorama - The Blog Directory

Small Acts Manifesto

Posts recentes

  • Habilitar o Linux no Chromebook
  • Review: Acer Chromebook C733
  • Eu não sou seu guru!
  • Ubuntu 20.10 está entre nós
  • Raspando a web com Java: parte 5

Arquivos

  • março 2021
  • dezembro 2020
  • outubro 2020
  • agosto 2020
  • julho 2020
  • junho 2020
  • maio 2020
  • abril 2020
  • março 2020
  • fevereiro 2020
  • janeiro 2020
  • dezembro 2019
  • outubro 2019
  • setembro 2019
  • junho 2019
  • maio 2019
  • abril 2019
  • março 2019
  • fevereiro 2019
  • janeiro 2019
  • dezembro 2018
  • setembro 2018
  • agosto 2018
  • julho 2018
  • junho 2018
  • maio 2018
  • abril 2018
  • março 2018
  • fevereiro 2018
  • janeiro 2018
  • dezembro 2017
  • novembro 2017
  • outubro 2017
  • setembro 2017
  • agosto 2017
  • julho 2017
  • junho 2017
  • maio 2017
  • abril 2017
  • março 2017
  • fevereiro 2017
  • janeiro 2017
  • dezembro 2016
  • novembro 2016
  • outubro 2016
  • setembro 2016
  • agosto 2016
  • julho 2016
  • junho 2016
  • maio 2016
  • abril 2016
  • março 2016
  • fevereiro 2016
  • janeiro 2016
  • dezembro 2015
  • novembro 2015
  • outubro 2015
  • setembro 2015
  • agosto 2015
  • julho 2015
  • junho 2015
  • maio 2015
  • abril 2015
  • março 2015
  • fevereiro 2015
  • janeiro 2015
  • dezembro 2014
  • novembro 2014
  • outubro 2014
  • setembro 2014
  • agosto 2014
  • junho 2014
  • abril 2014
  • março 2014
  • fevereiro 2014
  • janeiro 2014
  • dezembro 2013
  • novembro 2013
  • outubro 2013
  • agosto 2013
  • julho 2013
  • junho 2013
  • maio 2013
  • abril 2013
  • março 2013
  • fevereiro 2013
  • janeiro 2013
  • dezembro 2012
  • novembro 2012
  • outubro 2012
  • agosto 2011
  • junho 2011
  • maio 2011
  • abril 2011
  • março 2011
Proudly powered by WordPress | Theme: Doo by ThemeVS.