WebClient HttpWebRequest从网页中获取请求数据
WebClient
HttpWebRequest
//HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create(urlAddress);
//HttpWebResponse webResponse = (HttpWebResponse)webRequest.GetResponse();
//Stream stream = webResponse.GetResponseStream();
//StreamReader reader = new StreamReader(stream, System.Text.Encoding.GetEncoding("UTF-8"));
//string s = reader.ReadToEnd();
//Uri endpoint = new Uri(urlAddress);
//WebClient client = new WebClient();
//client.Encoding = Encoding.UTF8;
//byte[] bytes = client.DownloadData(endpoint);
//string s = System.Text.Encoding.UTF8.GetString(bytes);
Mircsoft在dotnet1.1框架下提供的向 URI 标识的资源发送数据和从 URI 标识的资源接收数据的公共方法。 通过这个类,大家可以在脱离浏览器的基础上模拟浏览器对互联网上的资源的访问和发送信息。 WebClient类不能被继承,在dotnet1.1框架中已经为我们提供了WebRequest和WebResponse两个强大的类来 处理向URI标示的资源和获取数据了。然后,不足的是利用WebRequest和WebResponse时设置过于复杂。 使用起来颇为费劲。于是乎有了现在的WebClient,WebClient其实可以理解为对WebRequest和WebResponse等 协作的封装。它使人们使用起来更加简单方便,然后它也有先天不足的地方。那就是缺少对cookies/session的 支持,用户无法对是否自动url转向的控制,还有就是缺少对代理服务器的支持。关于session/url转向控制/代理 服务器的使用我将在以后关于WebRequest/WebResponse的话题里面向大家介绍。下面先给大家简单介绍一 下WebClinet类。 类名:WebClient 命名空间System.Net.WebClient
公共构造函数
WebClient 构造函数 | 初始化 WebClient 类的新实例。 |
公共属性
BaseAddress | 获取或设置 WebClient 发出请求的基 URI。 |
Container(从 Component 继承) | 获取 IContainer,它包含 Component。 |
Credentials | 获取或设置用于对向 Internet 资源的请求进行身份验证的网络凭据。 |
Headers | 获取或设置与请求关联的标头名称/值对集合。 |
QueryString | 获取或设置与请求关联的查询名称/值对集合。 |
ResponseHeaders | 获取与响应关联的标头名称/值对集合。 |
Site(从 Component 继承) | 获取或设置 Component 的 ISite。 |
公共方法
CreateObjRef(从 MarshalByRefObject 继承) | 创建一个对象,该对象包含生成用于与远程对象进行通讯的代理所需的全部相关信息。 |
Dispose(从 Component 继承) | 已重载。释放由 Component 占用的资源。 |
DownloadData | 从具有指定 URI 的资源下载数据。 |
DownloadFile | 从具有指定 URI 的资源将数据下载到本地文件。 |
Equals(从 Object 继承) | 已重载。确定两个 Object 实例是否相等。 |
GetHashCode(从 Object 继承) | 用作特定类型的哈希函数,适合在哈希算法和数据结构(如哈希表)中使用。 |
GetLifetimeService(从 MarshalByRefObject 继承) | 检索控制此实例的生存期策略的当前生存期服务对象。 |
GetType(从 Object 继承) | 获取当前实例的 Type。 |
InitializeLifetimeService(从 MarshalByRefObject 继承) | 获取控制此实例的生存期策略的生存期服务对象。 |
OpenRead | 为从具有指定 URI 的资源下载的数据打开一个可读的流。 |
OpenWrite | 已重载。打开一个流以将数据写入具有指定 URI 的资源。 |
ToString(从 Object 继承) | 返回表示当前 Object 的 String。 |
UploadData | 已重载。将数据缓冲区上载到具有指定 URI 的资源。 |
UploadFile | 已重载。将本地文件上载到具有指定 URI 的资源。 |
UploadValues | 已重载。将名称/值集合上载到具有指定 URI 的资源。 |
从上表中我们可以看到WebClient提供四种将数据上载到资源的方法:
- OpenWrite 返回一个用于将数据发送到资源的 Stream。
- UploadData 将字节数组发送到资源并返回包含任何响应的字节数组。
- UploadFile 将本地文件发送到资源并返回包含任何响应的字节数组。
- UploadValues 将 NameValueCollection 发送到资源并返回包含任何响应的字节数组。
另外WebClient还提供三种从资源下载数据的方法:
- DownloadData 从资源下载数据并返回字节数组。
- DownloadFile 从资源将数据下载到本地文件。
- OpenRead 从资源以 Stream 的形式返回数据。
下面我们将通过一个简单的应用程序来测试WebClient的最简单用法作为本小节的结束让大家对WebClient有个初步的认识 例子1:利用WebClient实现对博客园首页的访问 首先我们用HttpLook对这次访问进行分析,为了方便分析我特别将浏览器对图片的访问去掉 让我们能看到更简便的分析结果 我们可以看到整个过程中我们发起了4次资源请求,其中第一次是对博客园首页进行访问 第二次访问的是样式表文件,第三和四次访问的是js脚本。 我们点击第一项可以看见关于这次资源访问的http头部信息,所谓http头部就是我们不能看见的浏览器和远程服务器传递的一些不可见元素。
这些http信息包含了浏览器访问的过程。其中 第一行:请求地址的相对路径和使用协议 相对路径为/ 协议采用http1.1 第二行:表示我们请求的资源种类。 第三行:我们的语言是简体中文。 第四行:我们使用的cup结构。这个http头在一般的网页中并不过见。估计是博客园的一次调查?? 第五行:标示采用gzip方式压缩html编码进行传递。只有一些浏览器支持的gzip解压缩时采用这种方式传递文本。由于我们 要写的程序不具备gzi解压缩的能力 所以我们不考虑使用这种方式发送请求。 第六行:浏览器说明 第七行:当前主机地址 第八行:连接请求状态 第九行:cookies信息 我在新建的应用程序里面利用WebClient来实现这了一过程。 下面我将就关键实现做一些解释
第一行:新建一个WebClient 实例_client 第二行~第七行:将上边捕捉到的Http头部放入到_client实例,注意第六行的被注释掉了。因为我们的程序无法进行gzip解码所以如果这样请求 获得的资源可能无法解码。当然我们可以给程序加入gzip处理的模块 那是题外话了。 第八行:利用_client.OpenRead(string URI)的方法获取网上资源的Stream 第九行:利用StreamReader将Stream用我们需要的编码方法去解析。这里使用了UTF8。对应不同的网站可以使用Default等不同的解码方法。 第十行:将我们解码后的内容放到textBox1里面显示出来 好了 大致关于WebClient的介绍就到这里了。以后将为大家陆续介绍WebClient的各种属性和方法。 利用WebClient做个资源小偷其实是很简单的,所以大家一定要防盗链阿!!!
这两天,遇到了一个winform联网获取数据的问题,于是从网上搜了些资料学习了一下,完了之后,也不能忘记总结。下面我就简单谈一下WebClient类的常见用法。
WebClient HttpWebRequest从网页中获取请求数据的更多相关文章
- 【在网页中获取截图数据】Chrome和Firefox下的实战经验
[转载自我在segmentfault的专栏:https://segmentfault.com/a/1190000004584071] 最近在实现一个功能,需求如下: 前提:当前页面无弹窗 页面任意位置 ...
- yii学习笔记(4),获取请求数据的request组件
yii在控制器中获取请求数据需要通过request组件来完成 <?php namespace app\controllers; use yii; use yii\web\Controller; ...
- 使用Xpath从网页中获取数据
/// <summary> /// 从官方网站中抓取产品信息存放在本地数据库中 /// </summary> /// <returns></returns&g ...
- 浅谈如何使用python抓取网页中的动态数据
我们经常会发现网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念, 动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到 ...
- web过滤器中获取请求的参数(content-type:multipart/form-data)
1.前言: 1.1 在使用springMVC中,需要在过滤器中获取请求中的参数token,根据token判断请求是否合法: 1.2 通过requst.getParameter(key)方法获得参数值; ...
- 解决网页中Waiting (TTFB)数据加载过慢的问题
解决网页中Waiting (TTFB)数据加载过慢的问题 最近做了一个网页,在本地测试良好,数据可以得到很快的反馈,但是当部署到云端Linux上时候,就会出现加载缓慢的问题.本地测试,得到数据大概3s ...
- angular开发中对请求数据层的封装
代码地址如下:http://www.demodashi.com/demo/11481.html 一.本章节仅仅是对angular4项目开发中数据请求封装到model中 仅仅是在项目angular4项目 ...
- python抓取网页中的动态数据
一.概念 网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器 ...
- SpringBoot web获取请求数据【转】
SpringBoot web获取请求数据 一个网站最基本的功能就是匹配请求,获取请求数据,处理请求(业务处理),请求响应,我们今天来看SpringBoot中怎么获取请求数据. 文章包含的内容如下: 获 ...
随机推荐
- unbound和mail服务的部署和简单应用
1.服务的介绍 Unbound是一个缓存DNS解析器.unbound官网 它使用根区域的内置权威名称服务器列表 (.),所谓的根提示.在收到DNS查询时,它会询问 答案的根名称服务器,几乎在所有情况下 ...
- 局域网内机器不能对ping问题
局域网内有台A机器能ping同其他机器,但其他机器不能ping A机器.属于同一个网段 解决办法: cmd->msconfig->常规->诊断启动,仅加载基本设备和服务. 重启后试下 ...
- BZOJ——T 3732: Network
http://www.lydsy.com/JudgeOnline/problem.php?id=3732 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: ...
- 利用日志文件恢复MYSQL数据库
利用日志文件恢复MYSQL数据库 650) this.width=650;" onclick='window.open("http://blog.51cto.com/viewpic ...
- Fragment-如何监听fragment中的回退事件与怎样保存fragment状态
一.如何监听Fragment中的回退事件 1.问题阐述 在Activity中监听回退事件是件非常容易的事,因为直接重写onBackPressed()函数就好了,但当大家想要监听Fragment中的回退 ...
- Kinect 开发 —— 引言
自然人机交互设计技术 (全息三维投影,手势肢体识别,眼动跟踪 ...) 符合人类心理的交互方式 自然用户界面 —— Natural User Interface 有机用户界面 —— Organic U ...
- BootStrap_Table 学习
https://blog.csdn.net/heting90/article/details/52248729 $("#realTime_Table").bootstrapTabl ...
- Block Manager
在Spark中,将数据抽象为Block(不论是shuffle数据,还是节点本身存储的数据),而每个driver/executor中的block都是由`BlockManager`这个类来负责管理的.对于 ...
- 1>LINK : fatal error LNK1123: 转换到 COFF 期间失败: 文件无效或损坏
解决方法如下:项目\属性\配置属性\清单工具\输入和输出\嵌入清单:原来是“是”,改成“否”. 终极解决方案:VS2010在经历一些更新后,建立Win32 Console Project时会出“err ...
- iptables---linux防火墙
iptables命令是Linux上常用的防火墙软件,是netfilter项目的一部分.可以直接配置,也可以通过许多前端和图形界面配置. 语法 iptables(选项)(参数) 选项 -t<表&g ...