HttpClient请求https的实例: package train; import java.io.IOException; import java.security.NoSuchAlgorithmException; import java.security.cert.CertificateException; import java.security.cert.X509Certificate; import javax.net.ssl.SSLContext; import javax.n…
HttpClient请求https的实例: package train; import java.io.IOException; import java.security.NoSuchAlgorithmException; import java.security.cert.CertificateException; import java.security.cert.X509Certificate; import javax.net.ssl.SSLContext; import javax.n…
网络爬虫专题--HTTP基本原理 URI和URL.URN的关系 超文本 HTTP和HTTPS URI和URL 首先,我们来了解一下URI和URL,URI,即统一资源标志符,URL,即统一资源定位符. 例如,https://github.com/favicon.ico,它是一个URL,也是一个URI.既有这样的一个图标资源,我们用URL/URI来唯一指定了它的访问方式,这其中包括了访问协议HTTPS.访问路径(即根目录)和资源名称favicon.ico.通过这样一个链接,我们便可以从互联网上到这个…
最终版:07_中证网(Plus -Pro).py # coding=utf-8 import requests from bs4 import BeautifulSoup import io import sys import os sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='gb18030') # 改变标准输出的默认编码 for qq in range(8): # query = input("[中证网]请输入你想搜索的…
1)Select Crawl Scope:Crawl Scope 用于配置当前应该在什么范围内抓取网页链接.例如选择 BroadScope 则表示当前的抓取范围不受限制,选择 HostScope 则表示抓取的范围在当前的 Host 范围内.在这里我们选择 org.archive.crawler.scope.BroadScope,并单击右边的 Change 按钮保存设置状态. 2)Select URI Frontier:Frontier 是一个 URL 的处理器,它决定下一个被处理的 URL 是什…
__new__与__init__的理解 __new__()方法是在创建实例之前被调用的,它的作用是创建一个实例,然后返回该实例对象,它是一个静态方法. __init__() 当实例被创建完成之后被调用的,然后设置对象属性的一些初始值,是一个实例方法. 也即:__new__先被调用,__init__后被调用,__new__方法中的返回值将实例传递给__init__方法中的第一个参数.然后__init__给这个实例设置一些初始参数. 注意: 1.继承自object的新式类才有__new__ 2.__…
一.HTTP协议 1.官方概念: HTTP协议是 Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(www.world wide web) 服务器传输超文本到本地浏览器的传送协议 2.白话概念: HTTP协议就是服务器(server) 和客户端(client)之间进行数据交互(相互传输数据)的一种形式,我们可以将 server 和 client 进行拟人化,那么该协议就是 server 和 client 这两兄弟间指定的一种交互沟通形式. 2.HT…
当我们使用resquests.get()时,返回的时response的对象,他包含服务器返回的所有信息,也包含请求的request的信息. 首先: response对象的属性有以下几个, r.status_code是http请求的返回状态,200表示连接成功,404表示连接失败,这时候应该抛出异常,进行处理. r.text是url对应的页面内容 r.encoding是从http的header中猜测的响应内容编码方式 r.apparent_encoding是从内容中分析出响应的内容编码方式. r.…
-----------------------------------------------------------学无止境------------------------------------------------------ 前言:大家好,欢迎来到誉雪飞舞的博客园,我的每篇文章都是自己用心编写, 算不上精心但是足够用心分享我的自学知识,希望大家能够指正我,互相学习成长. 转载请注明:https://www.cnblogs.com/wyl-pi/p/10510397.html 很多小伙伴…
-----------------------------------------------------------学无止境------------------------------------------------------ 前言:大家好,欢迎来到誉雪飞舞的博客园,我的每篇文章都是自己用心编写, 算不上精心但是足够用心分享我的自学知识,希望大家能够指正我,互相学习成长. 转载请注明:https://www.cnblogs.com/wyl-pi/p/10510599.html 这段话从百…