HttpWebRequest、HttpWebResponse获取网页

1，通过HttpWebRequest、HttpWebResponse获取一个流

                request =  (HttpWebRequest)System.Net.WebRequest.Create(this._url);

                HttpWebResponse response =  (HttpWebResponse)request.GetResponse();

                Stream  reciveStream =   response.GetResponseStream();

2，读取流成字符串

方法1：利用Stream的Read方法

 byte[] byteData = new byte[response.ContentLength];

                int count = byteData.Length, offset = ;

                while (count > )

                {

                    int n = reciveStream.Read(byteData, offset, count);

                    if (n == )

                    {

                        break;

                    }

                    offset += n;

                    count -= n;

                }

                string strHtml =  System.Text.Encoding.GetEncoding("utf-8").GetString(byteData);

                lstURL.Add(strHtml);

                response.Close();

方法1中的response.ContentLength可能为-1（和服务器的压缩有关），造成数组初始化失败。

网上方法：添加 request.Headers.Set("Accept-Encoding", "identity"); 强制服务器不压缩，但是我测试的时候总是超时，所以该方法可靠性不定。

建议不要用方法1，用下面的方法2。

方法2：利用StreamReader

using (StreamReader reader = new StreamReader(reciveStream, System.Text.Encoding.UTF8))

                {

                    string strHtml = reader.ReadToEnd();

                    lstURL.Add(strHtml);

                }

                response.Close();

注意点：

1，要关闭流。（选一个就可以了）

response.Close() 或 reciveStream.Close()

2，注意编码。

StreamReader默认使用utf-8。
不管是使用stream，还是streamReader，都建议根据具体网页内容，指定编码，不然会出现乱码。

HttpWebRequest、HttpWebResponse获取网页的更多相关文章

asp.net 利用HttpWebRequest自动获取网页编码并获取网页源代码
/// <summary> /// 获取源代码 /// </summary> /// <param name="url"></param& ...
C#获取网页内容 (WebClient、WebBrowser和HttpWebRequest/HttpWebResponse)
获取网页数据有很多种方式.在这里主要讲述通过WebClient.WebBrowser和HttpWebRequest/HttpWebResponse三种方式获取网页内容. 这里获取的是包括网页的所有信息 ...
C#网页采集数据的几种方式(WebClient、WebBrowser和HttpWebRequest/HttpWebResponse)
一.通过WebClient获取网页内容这是一种很简单的获取方式,当然,其它的获取方法也很简单.在这里首先要说明的是,如果为了实际项目的效率考虑,需要考虑在函数中分配一个内存区域.大概写法如下 //M ...
C# HttpWebRequest 绝技根据URL地址获取网页信息
如果要使用中间的方法的话,可以访问我的帮助类完全免费开源:C# HttpHelper,帮助类,真正的Httprequest请求时无视编码,无视证书,无视Cookie,网页抓取 1.第一招,根据URL地 ...
c#利用HttpWebRequest获取网页源代码
c#利用HttpWebRequest获取网页源代码,搞了好几天终于解决了,直接获取网站编码进行数据读取,再也不用担心乱码了! 命名空间:Using System.Net private static ...
利用HttpWebRequest和HttpWebResponse获取Cookie并实现模拟登录
利用HttpWebRequest和HttpWebResponse获取Cookie并实现模拟登录 tring cookie = response.Headers.Get("Set-Cookie ...
黄聪：C#获取网页HTML内容的三种方式
C#通常有三种方法获取网页内容,使用WebClient.WebBrowser或者HttpWebRequest/HttpWebResponse. 方法一:使用WebClient static void ...
C# 获取网页信息
获取网页源码 ///通过HttpWebResponse public string GetUrlHtml(string url) { string strHtml = string.Empty; Ht ...
c#利用WebClient和WebRequest获取网页源代码的比较
前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取 ...

随机推荐

利用 T-sql 的从句 for xml path('') 实现多行合并到一行, 并带有分隔符
T-sql 有一个for xml path('')的从句能把多行结果合并到一行,并成为xml 格式比如有一张表tb有两列,其格式和数据为: id value—————1 aa1 bb2 aaa2 b ...
[转]FutureTask详解
FutureTask类是Future 的一个实现,并实现了Runnable,所以可通过Excutor(线程池) 来执行,也可传递给Thread对象执行.如果在主线程中需要执行比较耗时的操作时,但又不 ...
Java – How to convert a primitive Array to List
Java – How to convert a primitive Array to ListCode snippets to convert a primitive array int[] to a ...
Java 8 Stream – Read a file line by line
In Java 8, you can use Files.lines to read file as Stream. c://lines.txt – A simple text file for te ...
zTree变异篇：如何让同级树节点平铺而非垂直显示
昨天有一个zTree的使用者在实际的项目中有着这样一个特殊的需求,要求同级树节点能够水平显示,根据设定的宽度自动换行,效果图如下所示: 通过在浏览器调试模式下观察其同级节点的css为: 这个dis ...
flowable 中task的相关操作
1 获取任务列表 1)获取候选人的任务列表 TaskService taskService = processEngine.getTaskService(); List<Task> tas ...
JAXB--@XmlElementWrapper注解和泛型一起使用
当java对象的某个属性使用泛型时,普通对象都没问题,但是遇到HashSet这种集合类封装的元素时,就会出现元素内容序列化不出来的问题,详见如下: 一.示例: 第一步:定义java对象 package ...
android 的build.gradle 的API手册
问题:对于用gradle的来配置java的开发者都能在GRADLE_HOME/docs/dsl找到如何对其build.gradle文件的具体属性. 但是对于开发android的开发者就不能对于官方的& ...
菜鸟学Java（十）——分页查询
今天继续跟大家说说一些非常基础的东西,这次我们说说分页查询.说到分页,可能很多人都听说过什么真分页.假分页的.简单解释一下,拿第二页,每页20条为例:真分:数据库里取的就是21-40条:假分:数据库 ...
破解AI大脑黑盒迈出新一步！谷歌现在更懂机器，还开源了研究工具
https://zhuanlan.zhihu.com/p/34306323 https://distill.pub/2018/building-blocks/

HttpWebRequest、HttpWebResponse获取网页

HttpWebRequest、HttpWebResponse获取网页的更多相关文章

随机推荐

热门专题