Python 爬取拉钩网工作岗位

如果拉钩网html页面做了调整,需要重新调整代码

代码如下

#/usr/bin/env python3

#coding:utf-8

import sys

import json

import requests

"""

Usage:

        python3 lagou.py  <Number> <positionName>

"""

def get_jobs(pn=1,kw="python"):

        url = 'https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false'

        payload = {"first":"false","pn":pn,"kd":kw}

        #payload = {'needAddtionalResult':'false'}

        rr = requests.post(url,data=payload)

        #print(r.json())

        jobs_data = rr.json()

        #print(jobs_data["content"]["positionResult"]["result"][0])

        jobs = jobs_data["content"]["positionResult"]["result"]

        for i in jobs:

                print("学历：" + i["education"])

                print("城市：" + i["city"])

        #       print("福利：" + i["companyLabelList"])

                print("薪资：" + i["salary"])

                print("职位：" + i["positionName"])

                print("要求：" + i["positionAdvantage"])

                print("经验：" + i["workYear"])

                print("链接：" + "https://www.lagou.com/jobs/" + str(i["positionId"]) + ".html")

                print()

if __name__ == '__main__':

        #pn表示页数，kw表示关键词搜索

        pn = sys.argv[1]

        kw = sys.argv[2]

        get_jobs(pn,kw)

Python 爬取拉钩网工作岗位的更多相关文章

爬取拉钩网上所有的python职位
# 2.爬取拉钩网上的所有python职位. from urllib import request,parse import json,random def user_agent(page): #浏览 ...
Python3 Scrapy + Selenium + 阿布云爬取拉钩网学习笔记
1 需求分析想要一个能爬取拉钩网职位详情页的爬虫,来获取详情页内的公司名称.职位名称.薪资待遇.学历要求.岗位需求等信息.该爬虫能够通过配置搜索职位关键字和搜索城市来爬取不同城市的不同职位详情信息, ...
selelinum+PhantomJS 爬取拉钩网职位
使用selenium+PhantomJS爬取拉钩网职位信息,保存在csv文件至本地磁盘拉钩网的职位页面,点击下一页,职位信息加载,但是浏览器的url的不变,说明数据不是发送get请求得到的. 我们不 ...
使用request爬取拉钩网信息
通过cookies信息爬取分析header和cookies 通过subtext粘贴处理header和cookies信息处理后,方便粘贴到代码中爬取拉钩信息代码 import requests c ...
Python 爬取拉钩
... from urllib import request from urllib import parse from urllib.error import URLError import jso ...
ruby 爬虫爬取拉钩网职位信息，产生词云报告
思路:1.获取拉勾网搜索到职位的页数 2.调用接口获取职位id 3.根据职位id访问页面,匹配出关键字 url访问采用unirest,由于拉钩反爬虫,短时间内频繁访问会被限制访问,所以没有采用多线程, ...
python爬取拉勾网职位数据
今天写的这篇文章是关于python爬虫简单的一个使用,选取的爬取对象是著名的招聘网站--拉钩网,由于和大家的职业息息相关,所以爬取拉钩的数据进行分析,对于职业规划和求职时的信息提供有很大的帮助. 完成 ...
使用nodejs爬取拉勾苏州和上海的.NET职位信息
最近开始找工作,本人苏州,面了几家都没有结果很是伤心.在拉勾上按照城市苏州关键字.NET来搜索一共才80来个职位,再用薪水一过滤,基本上没几个能投了.再加上最近苏州的房价蹭蹭的长,房贷压力也是非常大, ...
Python 爬取所有51VOA网站的Learn a words文本及mp3音频
Python 爬取所有51VOA网站的Learn a words文本及mp3音频 #!/usr/bin/env python # -*- coding: utf-8 -*- #Python 爬取所有5 ...

随机推荐

Delphi QueryPerformanceCounter、QueryPerformanceFrequency函数，精确定时到ns
var t1,t2:int64; r1,r2,r3:double; begin QueryPerformanceFrequency(c1);//WINDOWS API 返回计数频率 (Intel86: ...
Dart编程实例 - Dart 面向对象编程
Dart编程实例 - Dart 面向对象编程 class TestClass { void disp() { print("Hello World"); } } void main ...
管理员技术(七)： Linux管理员综合测试
一.Linux管理员综合测试目标: 根据本文提供的练习步骤完成所有练习案例. 方案: 开始练习之前,先依次重置虚拟机环境. [root@room9pc13 ~]# rht-vmctl reset ...
NX二次开发-Block UI C++界面Face Collector(面收集器)控件的获取(持续补充 )
Face Collector(面收集器)控件的获取 NX9+VS2012 #include <uf.h> #include <uf_obj.h> UF_initialize() ...
JZOI1062 【USACO2013JAN】invite
#include <bits/stdc++.h> #define ll long long #define INF 2147483647 #define ll_INF 9223372036 ...
ZROI week1
\[ZROI day1\] \[Grid\] 题目描述给定一个矩阵,小写字母,求一条路径使得从\((1,1) -> (n,m)\),字典序最小,并且每次只能向右或者向下. 题解先考虑如果没有 ...
vs2012+wdk8.0 搭建wdf驱动开发环境
开发环境搭建: 系统:win7 x64 工具:vs2012 + WDK8.0 插件:wdfcoinstaller.msi (1)先安装vs2012,再安装wdk8.0,这样在打开vs2012时可以创建 ...
caller.arguments.callee.eval
------------------------------------ 1.函数的调用方式,与this的指向问题,原型对象中的this 2.对象创建的几种方式! 3.str.replace 页面初始 ...
vbs 之 wscript
https://www.jb51.net/article/20919.htm '''''''''''''''''''''''''''''''''''''''''''''''''''''''''' ' ...
改变IntelliJ IDEA 中的system和config/plugins的默认C盘的路径
1,问题,在为idea在线安装插件时,如JProfiler,会默认安装到C盘,而本人则是希望安装到软件所在的D盘目录下,那么如何修改呢: C:\Users\xxx\.IntelliJIdea\conf ...

Python 爬取拉钩网工作岗位

Python 爬取拉钩网工作岗位的更多相关文章

随机推荐

热门专题