新软件马上就要完成了,先发篇文章YY下
最近一直都在搞网站抓取方面的开发,闲着无聊逛逛论坛,发现有些帖子还是写的相当不错的,只是一篇一篇的点进去比较麻烦,于是就写了个小软件只是为了方便查看博客园和CSDN上的优秀文章。其实这个还可以拓展的,比如说可以添加RSS功能,查看新闻网站的新闻。代码比较简单,可以考虑用个工厂模式。
写的比较乱,都不敢上代码了。求大神喷!
2013-6-28号更新
1、添加了皮肤
2013-6-29号更新
1、解决了ListView控件添加数据闪烁问题。
2、取消皮肤加快数据加载速度
3、优化了浏览文章体验
里面有几个类库非常不错,想要的可以拿去。
- ///
- /// 类说明:HttpHelps类,用来实现Http访问,Post或者Get方式的,直接访问,带Cookie的,带证书的等方式,可以设置代理
- /// 重要提示:请不要自行修改本类,如果因为你自己修改后将无法升级到新版本。如果确实有什么问题请到官方网站提建议,
- /// 我们一定会及时修改
- /// 编码日期:2011-09-20
- /// 编 码 人:苏飞
- /// 联系方式:361983679
- /// 官方网址:http://www.sufeinet.com/thread-3-1-1.html
- /// 修改日期:2013-04-14
- ///
- using System;
- using System.Collections.Generic;
- using System.Text;
- using System.Net;
- using System.IO;
- using System.Text.RegularExpressions;
- using System.IO.Compression;
- using System.Security.Cryptography.X509Certificates;
- using System.Net.Security;
- namespace Common.PageHelper
- {
- ///
- /// Http连接操作帮助类
- ///
- public class HttpHelper
- {
- #region 预定义方法或者变更
- //默认的编码
- private Encoding encoding = Encoding.Default;
- //HttpWebRequest对象用来发起请求
- private HttpWebRequest request = null;
- //获取影响流的数据对象
- private HttpWebResponse response = null;
- ///
- /// 根据相传入的数据,得到相应页面数据
- ///
- ///参数类对象
- ///返回HttpResult类型
- private HttpResult GetHttpRequestData(HttpItem objhttpitem)
- {
- //返回参数
- HttpResult result = new HttpResult();
- try
- {
- #region 得到请求的response
- using (response = (HttpWebResponse)request.GetResponse())
- {
- result.StatusCode = response.StatusCode;
- result.StatusDescription = response.StatusDescription;
- result.Header = response.Headers;
- if (response.Cookies != null)
- result.CookieCollection = response.Cookies;
- if (response.Headers["set-cookie"] != null)
- result.Cookie = response.Headers["set-cookie"];
- MemoryStream _stream = new MemoryStream();
- //GZIIP处理
- if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase))
- {
- //开始读取流并设置编码方式
- //new GZipStream(response.GetResponseStream(), CompressionMode.Decompress).CopyTo(_stream, 10240);
- //.net4.0以下写法
- _stream = GetMemoryStream(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress));
- }
- else
- {
- //开始读取流并设置编码方式
- //response.GetResponseStream().CopyTo(_stream, 10240);
- //.net4.0以下写法
- _stream = GetMemoryStream(response.GetResponseStream());
- }
- //获取Byte
- byte[] RawResponse = _stream.ToArray();
- _stream.Close();
- //是否返回Byte类型数据
- if (objhttpitem.ResultType == ResultType.Byte)
- result.ResultByte = RawResponse;
- //从这里开始我们要无视编码了
- if (encoding == null)
- {
- Match meta = Regex.Match(Encoding.Default.GetString(RawResponse), "<meta([^<]*)charset=([^<]*)[\"']", RegexOptions.IgnoreCase);
- string charter = (meta.Groups.Count > 2) ? meta.Groups[2].Value.ToLower() : string.Empty;
- charter = charter.Replace("\"", "").Replace("'", "").Replace(";", "").Replace("iso-8859-1", "gbk");
- if (charter.Length > 2)
- encoding = Encoding.GetEncoding(charter);
- else
- {
- if (string.IsNullOrEmpty(response.CharacterSet))
- encoding = Encoding.UTF8;
- else
- encoding = Encoding.GetEncoding(response.CharacterSet);
- }
- }
- //得到返回的HTML
- result.Html = encoding.GetString(RawResponse);
- }
- #endregion
- }
- catch (WebException ex)
- {
- //这里是在发生异常时返回的错误信息
- response = (HttpWebResponse)ex.Response;
- result.Html = ex.Message;
- result.StatusCode = response.StatusCode;
- result.StatusDescription = response.StatusDescription;
- }
- catch (Exception ex)
- {
- result.Html = ex.Message;
- }
- if (objhttpitem.IsToLower)
- result.Html = result.Html.ToLower();
- return result;
- }
- ///
- /// 4.0以下.net版本取数据使用
- ///
- ///流
- private static MemoryStream GetMemoryStream(Stream streamResponse)
- {
- MemoryStream _stream = new MemoryStream();
- int Length = 256;
- Byte[] buffer = new Byte[Length];
- int bytesRead = streamResponse.Read(buffer, 0, Length);
- // write the required bytes
- while (bytesRead > 0)
- {
- _stream.Write(buffer, 0, bytesRead);
- bytesRead = streamResponse.Read(buffer, 0, Length);
- }
- return _stream;
- }
- ///
- /// 为请求准备参数
- ///
- ///参数列表
- ///读取数据时的编码方式
- private void SetRequest(HttpItem objhttpItem)
- {
- // 验证证书
- SetCer(objhttpItem);
- //设置Header参数
- if (objhttpItem.Header != null && objhttpItem.Header.Count > 0)
- {
- foreach (string item in objhttpItem.Header.AllKeys)
- {
- request.Headers.Add(item, objhttpItem.Header[item]);
- }
- }
- // 设置代理
- SetProxy(objhttpItem);
- //请求方式Get或者Post
- request.Method = objhttpItem.Method;
- request.Timeout = objhttpItem.Timeout;
- request.ReadWriteTimeout = objhttpItem.ReadWriteTimeout;
- //Accept
- request.Accept = objhttpItem.Accept;
- //ContentType返回类型
- request.ContentType = objhttpItem.ContentType;
- //UserAgent客户端的访问类型,包括浏览器版本和操作系统信息
- request.UserAgent = objhttpItem.UserAgent;
- // 编码
- encoding = objhttpItem.Encoding;
- //设置Cookie
- SetCookie(objhttpItem);
- //来源地址
- request.Referer = objhttpItem.Referer;
- //是否执行跳转功能
- request.AllowAutoRedirect = objhttpItem.Allowautoredirect;
- //设置Post数据
- SetPostData(objhttpItem);
- //设置最大连接
- if (objhttpItem.Connectionlimit > 0)
- request.ServicePoint.ConnectionLimit = objhttpItem.Connectionlimit;
- }
- ///
- /// 设置证书
- ///
- ///
- private void SetCer(HttpItem objhttpItem)
- {
- if (!string.IsNullOrEmpty(objhttpItem.CerPath))
- {
- //这一句一定要写在创建连接的前面。使用回调的方法进行证书验证。
- ServicePointManager.ServerCertificateValidationCallback = new System.Net.Security.RemoteCertificateValidationCallback(CheckValidationResult);
- //初始化对像,并设置请求的URL地址
- request = (HttpWebRequest)WebRequest.Create(objhttpItem.URL);
- //将证书添加到请求里
- request.ClientCertificates.Add(new X509Certificate(objhttpItem.CerPath));
- }
- else
- //初始化对像,并设置请求的URL地址
- request = (HttpWebRequest)WebRequest.Create(objhttpItem.URL);
- }
- ///
- /// 设置Cookie
- ///
- ///Http参数
- private void SetCookie(HttpItem objhttpItem)
- {
- if (!string.IsNullOrEmpty(objhttpItem.Cookie))
- //Cookie
- request.Headers[HttpRequestHeader.Cookie] = objhttpItem.Cookie;
- //设置Cookie
- if (objhttpItem.CookieCollection != null)
- {
- request.CookieContainer = new CookieContainer();
- request.CookieContainer.Add(objhttpItem.CookieCollection);
- }
- }
- ///
- /// 设置Post数据
- ///
- ///Http参数
- private void SetPostData(HttpItem objhttpItem)
- {
- //验证在得到结果时是否有传入数据
- if (request.Method.Trim().ToLower().Contains("post"))
- {
- byte[] buffer = null;
- //写入Byte类型
- if (objhttpItem.PostDataType == PostDataType.Byte && objhttpItem.PostdataByte != null && objhttpItem.PostdataByte.Length > 0)
- {
- //验证在得到结果时是否有传入数据
- buffer = objhttpItem.PostdataByte;
- }//写入文件
- else if (objhttpItem.PostDataType == PostDataType.FilePath && !string.IsNullOrEmpty(objhttpItem.Postdata))
- {
- StreamReader r = new StreamReader(objhttpItem.Postdata, encoding);
- buffer = Encoding.Default.GetBytes(r.ReadToEnd());
- r.Close();
- } //写入字符串
- else if (!string.IsNullOrEmpty(objhttpItem.Postdata))
- {
- buffer = Encoding.Default.GetBytes(objhttpItem.Postdata);
- }
- if (buffer != null)
- {
- request.ContentLength = buffer.Length;
- request.GetRequestStream().Write(buffer, 0, buffer.Length);
- }
- }
- }
- ///
- /// 设置代理
- ///
- ///参数对象
- private void SetProxy(HttpItem objhttpItem)
- {
- if (!string.IsNullOrEmpty(objhttpItem.ProxyIp))
- {
- //设置代理服务器
- WebProxy myProxy = new WebProxy(objhttpItem.ProxyIp, false);
- //建议连接
- myProxy.Credentials = new NetworkCredential(objhttpItem.ProxyUserName, objhttpItem.ProxyPwd);
- //给当前请求对象
- request.Proxy = myProxy;
- //设置安全凭证
- request.Credentials = CredentialCache.DefaultNetworkCredentials;
- }
- }
- ///
- /// 回调验证证书问题
- ///
- ///流对象
- ///证书
- ///X509Chain
- ///SslPolicyErrors
- ///bool
- public bool CheckValidationResult(object sender, X509Certificate certificate, X509Chain chain, SslPolicyErrors errors)
- {
- // 总是接受
- return true;
- }
- #endregion
- #region 普通类型
- ///
- ///采用https协议访问网络,根据传入的URl地址,得到响应的数据字符串。
- ///
- ///参数列表
- ///String类型的数据
- public HttpResult GetHtml(HttpItem objhttpItem)
- {
- try
- {
- //准备参数
- SetRequest(objhttpItem);
- }
- catch (Exception ex)
- {
- return new HttpResult() { Cookie = "", Header = null, Html = ex.Message, StatusDescription = "配置参考时报错" };
- }
- //调用专门读取数据的类
- return GetHttpRequestData(objhttpItem);
- }
- #endregion
- }
- ///
- /// Http请求参考类
- ///
- public class HttpItem
- {
- string _URL = string.Empty;
- ///
- /// 请求URL必须填写
- ///
- public string URL
- {
- get { return _URL; }
- set { _URL = value; }
- }
- string _Method = "GET";
- ///
- /// 请求方式默认为GET方式,当为POST方式时必须设置Postdata的值
- ///
- public string Method
- {
- get { return _Method; }
- set { _Method = value; }
- }
- int _Timeout = 100000;
- ///
- /// 默认请求超时时间
- ///
- public int Timeout
- {
- get { return _Timeout; }
- set { _Timeout = value; }
- }
- int _ReadWriteTimeout = 30000;
- ///
- /// 默认写入Post数据超时间
- ///
- public int ReadWriteTimeout
- {
- get { return _ReadWriteTimeout; }
- set { _ReadWriteTimeout = value; }
- }
- string _Accept = "text/html, application/xhtml+xml, */*";
- ///
- /// 请求标头值 默认为text/html, application/xhtml+xml, */*
- ///
- public string Accept
- {
- get { return _Accept; }
- set { _Accept = value; }
- }
- string _ContentType = "text/html";
- ///
- /// 请求返回类型默认 text/html
- ///
- public string ContentType
- {
- get { return _ContentType; }
- set { _ContentType = value; }
- }
- string _UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)";
- ///
- /// 客户端访问信息默认Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)
- ///
- public string UserAgent
- {
- get { return _UserAgent; }
- set { _UserAgent = value; }
- }
- Encoding _Encoding = null;
- ///
- /// 返回数据编码默认为NUll,可以自动识别,一般为utf-8,gbk,gb2312
- ///
- public Encoding Encoding
- {
- get { return _Encoding; }
- set { _Encoding = value; }
- }
- private PostDataType _PostDataType = PostDataType.String;
- ///
- /// Post的数据类型
- ///
- public PostDataType PostDataType
- {
- get { return _PostDataType; }
- set { _PostDataType = value; }
- }
- string _Postdata = string.Empty;
- ///
- /// Post请求时要发送的字符串Post数据
- ///
- public string Postdata
- {
- get { return _Postdata; }
- set { _Postdata = value; }
- }
- private byte[] _PostdataByte = null;
- ///
- /// Post请求时要发送的Byte类型的Post数据
- ///
- public byte[] PostdataByte
- {
- get { return _PostdataByte; }
- set { _PostdataByte = value; }
- }
- CookieCollection cookiecollection = null;
- ///
- /// Cookie对象集合
- ///
- public CookieCollection CookieCollection
- {
- get { return cookiecollection; }
- set { cookiecollection = value; }
- }
- string _Cookie = string.Empty;
- ///
- /// 请求时的Cookie
- ///
- public string Cookie
- {
- get { return _Cookie; }
- set { _Cookie = value; }
- }
- string _Referer = string.Empty;
- ///
- /// 来源地址,上次访问地址
- ///
- public string Referer
- {
- get { return _Referer; }
- set { _Referer = value; }
- }
- string _CerPath = string.Empty;
- ///
- /// 证书绝对路径
- ///
- public string CerPath
- {
- get { return _CerPath; }
- set { _CerPath = value; }
- }
- private Boolean isToLower = false;
- ///
- /// 是否设置为全文小写,默认为不转化
- ///
- public Boolean IsToLower
- {
- get { return isToLower; }
- set { isToLower = value; }
- }
- private Boolean allowautoredirect = false;
- ///
- /// 支持跳转页面,查询结果将是跳转后的页面,默认是不跳转
- ///
- public Boolean Allowautoredirect
- {
- get { return allowautoredirect; }
- set { allowautoredirect = value; }
- }
- private int connectionlimit = 1024;
- ///
- /// 最大连接数
- ///
- public int Connectionlimit
- {
- get { return connectionlimit; }
- set { connectionlimit = value; }
- }
- private string proxyusername = string.Empty;
- ///
- /// 代理Proxy 服务器用户名
- ///
- public string ProxyUserName
- {
- get { return proxyusername; }
- set { proxyusername = value; }
- }
- private string proxypwd = string.Empty;
- ///
- /// 代理 服务器密码
- ///
- public string ProxyPwd
- {
- get { return proxypwd; }
- set { proxypwd = value; }
- }
- private string proxyip = string.Empty;
- ///
- /// 代理 服务IP
- ///
- public string ProxyIp
- {
- get { return proxyip; }
- set { proxyip = value; }
- }
- private ResultType resulttype = ResultType.String;
- ///
- /// 设置返回类型String和Byte
- ///
- public ResultType ResultType
- {
- get { return resulttype; }
- set { resulttype = value; }
- }
- private WebHeaderCollection header = new WebHeaderCollection();
- //header对象
- public WebHeaderCollection Header
- {
- get { return header; }
- set { header = value; }
- }
- }
- ///
- /// Http返回参数类
- ///
- public class HttpResult
- {
- string _Cookie = string.Empty;
- ///
- /// Http请求返回的Cookie
- ///
- public string Cookie
- {
- get { return _Cookie; }
- set { _Cookie = value; }
- }
- CookieCollection cookiecollection = new CookieCollection();
- ///
- /// Cookie对象集合
- ///
- public CookieCollection CookieCollection
- {
- get { return cookiecollection; }
- set { cookiecollection = value; }
- }
- private string html = string.Empty;
- ///
- /// 返回的String类型数据 只有ResultType.String时才返回数据,其它情况为空
- ///
- public string Html
- {
- get { return html; }
- set { html = value; }
- }
- private byte[] resultbyte = null;
- ///
- /// 返回的Byte数组 只有ResultType.Byte时才返回数据,其它情况为空
- ///
- public byte[] ResultByte
- {
- get { return resultbyte; }
- set { resultbyte = value; }
- }
- private WebHeaderCollection header = new WebHeaderCollection();
- //header对象
- public WebHeaderCollection Header
- {
- get { return header; }
- set { header = value; }
- }
- private string statusDescription = "";
- ///
- /// 返回状态说明
- ///
- public string StatusDescription
- {
- get { return statusDescription; }
- set { statusDescription = value; }
- }
- private HttpStatusCode statusCode = HttpStatusCode.OK;
- ///
- /// 返回状态码,默认为OK
- ///
- public HttpStatusCode StatusCode
- {
- get { return statusCode; }
- set { statusCode = value; }
- }
- }
- ///
- /// 返回类型
- ///
- public enum ResultType
- {
- ///
- /// 表示只返回字符串 只有Html有数据
- ///
- String,
- ///
- /// 表示返回字符串和字节流 ResultByte和Html都有数据返回
- ///
- Byte
- }
- ///
- /// Post的数据格式默认为string
- ///
- public enum PostDataType
- {
- ///
- /// 字符串类型,这时编码Encoding可不设置
- ///
- String,
- ///
- /// Byte类型,需要设置PostdataByte参数的值编码Encoding可设置为空
- ///
- Byte,
- ///
- /// 传文件,Postdata必须设置为文件的绝对路径,必须设置Encoding的值
- ///
- FilePath
- }
- }
新软件马上就要完成了,先发篇文章YY下的更多相关文章
- 工作中的开发过程(Javaweb路线,写给刚刚实习或者马上就要工作的朋友)
工作中的开发过程(Javaweb路线,写给刚刚实习或者马上就要工作的朋友) 当我还没开始工作的时候,我是对实际项目开发流程充满未知和向往的,当时很希望能够有一个过来人,给我介绍一下实际工作起来是什么样 ...
- Linux负载均衡软件LVS之二(安装篇)[转]
Linux负载均衡软件LVS之二(安装篇) 2011-04-26 16:01:47 标签:lvs安装配置 linux lvs 休闲 linux高可用 原创作品,允许转载,转载时请务必以超链接形式标明文 ...
- 苹果 AR 新专利马上登陆 Facetime|Facebook 要用 VR 玩直播
附上VR技术福利视频 链接: https://pan.baidu.com/s/1boGGVs7 密码: viy8 点击关注有更多VR技术资源哦 苹果 AR 新专利马上登陆 Facetime ,使用光场 ...
- ubuntu要安装新软件,已有deb安装包
如果ubuntu要安装新软件,已有deb安装包(例如:iptux.deb),但是无法登录到桌面环境.那该怎么安装?答案是:使用dpkg命令.dpkg命令常用格式如下:sudo dpkg -I iptu ...
- Docker这个新软件究竟是用来干嘛的???
http://dockone.io/article/378 尝试新软件 对开发者而言,每天会催生出的各式各样的新技术都需要尝试,然而开发者却不太可能为他们一一搭建好环境并进行测试.时间非常宝贵,正是得 ...
- 【原创】JDK 9-17新功能30分钟详解-语法篇-var
JDK 9-17新功能30分钟详解-语法篇-var 介绍 JDK 10 JDK 10新增了新的关键字--var,官方文档说作用是: Enhance the Java Language to exten ...
- github使用-知乎的某小姐的一篇文章
作者:珊姗是个小太阳链接:http://www.zhihu.com/question/20070065/answer/79557687来源:知乎著作权归作者所有,转载请联系作者获得授权. 作为一个文科 ...
- Java设计模式(十三) 别人再问你设计模式,叫他看这篇文章
原创文章,转载请务注明出处 OOP三大基本特性 封装 封装,也就是把客观事物封装成抽象的类,并且类可以把自己的属性和方法只让可信的类操作,对不可信的进行信息隐藏. 继承 继承是指这样一种能力,它可以使 ...
- APP的缓存文件到底应该存在哪?看完这篇文章你应该就自己清楚了
APP的缓存文件到底应该存在哪?看完这篇文章你应该就自己清楚了 彻底理解android中的内部存储与外部存储 存储在内部还是外部 所有的Android设备均有两个文件存储区域:"intern ...
随机推荐
- SpecFlow - Cucumber for .NET
SpecFlow使用入门 SpecFlow是一个BDD工具,在这里对BDD不多赘述,你可以阅读一下微软2010年十二月的一篇文章,此外如果你想要更多了解SpecFlow,可以参考我的另一篇翻译(当然, ...
- Android学习路径——Android的四个组成部分activity(一)
一.什么是Activity? Activity简单的说就是一个接口.我们是Android手机上看到的每个界面就是一个activity. 二.Activity的创建 1.定义一个类继承activity, ...
- windows下架设SVN服务器并设置开机启动
原文:windows下架设SVN服务器并设置开机启动 1.安装SVN服务器,到http://subversion.apache.org/packages.html上下载windows版的SVN,并安装 ...
- 【转载】Android中ListView下拉刷新的实现
在网上看到一个下拉刷新的例子,很的很棒,转载和更多的人分享学习 原文:http://blog.csdn.net/loongggdroid/article/details/9385535 ListVie ...
- OpenGL绘制棱锥,剔除
/** * 缓冲区工具类 */public class BufferUtil { /** * 将浮点数组转换成字节缓冲区 */ public static ByteBuffer arr2ByteB ...
- linux find命令之exec
find是我们很常用的一个Linux命令,但是我们一般查找出来的并不仅仅是看看而已,还会有进一步的操作,这个时候exec的作用就显现出来了. exec解释: -exec 参数后面跟的是command ...
- python chanllenge题解
网址:chanllenge 修改url最后的html的前缀为答案,就可以过关. 页面上很多只有一幅图片,实际上题目描述全在页面源码中. 然后推荐一个在线代码运行的网站 ideone 查看所有源码:ht ...
- 利用redis的订阅和发布来实现实时监控的一个DEMO(Python版本)
redis的list类型有个很好的特性,就是每次添加元素后会返回当前list的长度,利用这个特点,我们可以监控它的长度,比如我们的key是用户注册的IP地址,list中存放的是已经在此IP地址上注册的 ...
- 【欧拉计划4】Largest palindrome product
欢迎访问我的新博客:http://www.milkcu.com/blog/ 原文地址:http://www.milkcu.com/blog/archives/1371281760.html 原创:[欧 ...
- iOS基础 - UITableViewController
1. 继承UITableViewController默认会设置数据源和代理,并且会自动遵守数据源和代理协议,并且self.tableView 相当于 self.view 2.更换控制器时,注意把sto ...