（java）Jsoup爬虫学习--获取智联招聘（老网站）的全国java职位信息，爬取10页

Jsoup爬虫学习--获取智联招聘（老网站）的全国java职位信息，爬取10页，输出

职位名称*****公司名称*****职位月薪*****工作地点*****发布日期

import java.io.IOException;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

public class JsoupHtml {

    public static void main(String[] args) {

        new JsoupHtml().getZhiLianWork();

    }

    public void getZhiLianWork(){

        try {

            for (int i=0;i<10;i++) {

                    System.out.println("*********开始遍历第"+(i+1)+"页的求职信息*********");

                    Document doc = Jsoup.connect("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=-1&kw=java&p="+(i+1)+"&isadv=0").get();

                    Element content = doc.getElementById("newlist_list_content_table");

                    Elements zwmcEls = content.getElementsByClass("zwmc");

                    Elements gsmcEls = content.getElementsByClass("gsmc");

                    Elements zwyxEls = content.getElementsByClass("zwyx");

                    Elements gzddEls = content.getElementsByClass("gzdd");

                    Elements gxsjEls = content.getElementsByClass("gxsj");

                    for(int j = 0;j<zwmcEls .size();j++){

                        System.out.println(

                                zwmcEls.get(j).tagName("a").text()+"*****"+gsmcEls.get(j).tagName("a").text()+

                                "*****"+zwyxEls.get(j).tagName("a").text()+"*****"+gzddEls.get(j).tagName("a").text()+

                                "*****"+gxsjEls.get(j).tagName("a").text());

                        System.out.println();

                }

                    System.out.println("*********结束遍历第"+(i+1)+"页的求职信息*********");

            }

        } catch (IOException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

    }

}

输出结果示例：

产品经理??*****微贷(杭州)金融信息服务有限公司*****4500-8000*****杭州-滨江区*****置顶

软件工程师??*****重庆建工信息技术有限公司*****5000-7000*****重庆*****置顶

php高级研发工程师??*****西安联合创想电子商务有限公司*****15000-30000*****西安*****置顶

（java）Jsoup爬虫学习--获取智联招聘（老网站）的全国java职位信息，爬取10页的更多相关文章

（java）Jsoup爬虫学习--获取网页所有的图片，链接和其他信息，并检查url和文本信息
Jsoup爬虫学习--获取网页所有的图片,链接和其他信息,并检查url和文本信息此例将页面图片和url全部输出,重点不太明确,可根据自己的需要输出和截取: import org.jsoup.Jsou ...
python爬虫实战（五）--------智联招聘网
前些天帮同事爬取一些智联招聘网上的关于数据分析的职位信息,他说要做一些数据分析看看,现在已经帮他爬完了.我本来想用Scrapy来爬的,但是不知道为什么爬取的数据和真实搜到的数据不太一样,比如:搜索到的 ...
5分钟掌握智联招聘网站爬取并保存到MongoDB数据库
前言本次主题分两篇文章来介绍: 一.数据采集二.数据分析第一篇先来介绍数据采集,即用python爬取网站数据. 1 运行环境和python库先说下运行环境: python3.5 windows ...
Python+selenium爬取智联招聘的职位信息
整个爬虫是基于selenium和Python来运行的,运行需要的包 mysql,matplotlib,selenium 需要安装selenium火狐浏览器驱动,百度的搜寻. 整个爬虫是模块化组织的,不 ...
node.js 89行爬虫爬取智联招聘信息
写在前面的话, .......写个P,直接上效果图.附上源码地址 github/lonhon ok,正文开始,先列出用到的和require的东西: node.js,这个是必须的 request,然发 ...
我用 Python 爬了智联“北上广深”5400条 Java 招聘数据
结论国际惯例,先上结论. Java 类职位招聘,不论是需求量(工作机会),还是工资平均水平,都是帝都北京最好. 北京和上海的平均工资差距不大(不超过200/月),但上海的需求量是北京的一半,机会更少 ...
python3爬虫抓取智联招聘职位信息代码
上代码,有问题欢迎留言指出. # -*- coding: utf-8 -*- """ Created on Tue Aug 7 20:41:09 2018 @author ...
python爬取智联招聘职位信息（多进程）
测试了下,采用单进程爬取5000条数据大概需要22分钟,速度太慢了点.我们把脚本改进下,采用多进程. 首先获取所有要爬取的URL,在这里不建议使用集合,字典或列表的数据类型来保存这些URL,因为数据量 ...
python爬取智联招聘职位信息（单进程）
我们先通过百度搜索智联招聘,进入智联招聘官网,一看,傻眼了,需要登录才能查看招聘信息没办法,用账号登录进去,登录后的网页如下: 输入职位名称点击搜索,显示如下网页: 把这个URL:https://s ...

随机推荐

sql 查找所有员工信息（俩表连接查询）
题目描述查找所有员工的last_name和first_name以及对应部门编号dept_no,也包括展示没有分配具体部门的员工CREATE TABLE `dept_emp` (`emp_no` in ...
Java程序运行机制
Java程序运行机制编译型(compile) 它有一个负责翻译的程序(编译器),将我们写的 Java 源代码转为计算机可执行的代码举个例子:把一本中文书翻译成英文书应用:操作系统.C.C++ 解 ...
Mongodb CPU占用率达90%的优化调整报告
1问题描述 1.1现场的数据库部署情况服务器基本情况如下: CPU 20逻辑核,40线程内存 64 G 硬盘 D盘 :1T SSD E盘:3T SATA F盘:3T SATA 在这台机器上同时部署 ...
[06]Go设计模式:适配器模式（Adapter Pattern）
目录适配器模式一.简介二.代码三.参考资料适配器模式一.简介适配器模式(Adapter Pattern)是作为两个不兼容的接口之间的桥梁.这种类型的设计模式属于结构型模式,它结合了两个独 ...
在iis中部署网站出现的错误
第一次错误: 解决的方案:点击网站新建一个同名的应用池,选择网站的基本设置,选中同名的应用池接下来可能会有第二个错误错误摘要HTTP 错误 500.21 - Internal Server Err ...
宁夏网络赛-F-Moving On
https://www.cnblogs.com/31415926535x/p/11440395.html 一道简单的Floyd题,,但是是动态加点求多次有限制的最短路,,感觉这个思想很好,,当然可以直 ...
Linux iptables常用防火墙规则
iptables -A INPUT -s 127.0.0.1 -d 127.0.0.1 -j ACCEPT #允许本地回环接口(即运行本机访问本机) iptables -A INPUT -m stat ...
java之结合代码理解synchronized关键字
为了保证数据的一致性即实现线程的安全性,java虚拟机提供了同步和锁机制.synchronized关键字是最基本的互斥同步手段.除此之外,还可以使用java.util.concurrent包中的重入锁 ...
JS获取时间差
Date.parse(String string)转为毫秒数进行比较
使用activiti的designer插件记录
1.activiti添加排他网,条件下载condition中 2.activiti添加监听Listener,知道3种方法 1.实现taskListener 通过加载java class的方式去加载实现 ...

（java）Jsoup爬虫学习--获取智联招聘（老网站）的全国java职位信息，爬取10页

（java）Jsoup爬虫学习--获取智联招聘（老网站）的全国java职位信息，爬取10页的更多相关文章

随机推荐

热门专题