使用GET与POST方式获取html数据
抓取网站数据解析的工作,其中,使用到GET和POST方法获取html数据。
使用GET方式:
- /**
- * 使用get方式获取html数据
- *
- * @param strURL(需要访问的网站)
- * @return
- * @throws Exception
- */
- public String getHTML(String strURL) throws Exception {
- //创建浏览器
- HttpClient httpClient = HttpClients.createDefault();
- String html = null;
- //预防网址链接中包含特殊字符,将url转为uri
- URL url = new URL(strURL);
- URI uri = new URI(url.getProtocol(), url.getHost(), url.getPath(),
- url.getQuery(), null);
- //使用get方式
- HttpGet request = new HttpGet(uri);
- HttpResponse response;
- try {
- //连接网址获取返回的数据
- response = httpClient.execute(request);
- //将返回的数据按照gbk的方式编码
- html = EntityUtils.toString(response.getEntity(), "GBK");
- } catch (IOException e) {
- e.printStackTrace();
- }
- //断开连接
- request.abort();
- //返回网址所发挥的html数据
- return html;
- }
使用该方法便可以获取得到网站所发挥的html数据。
使用POST方式:
- /**
- * 使用post方式获取html数据
- *
- * @param libraryUrl(需要访问的网站)
- * @param params(需要传入的参数)
- * @return
- * @throws Exception
- */
- public String postHTML(String strURL, List<NameValuePair> params)
- throws Exception {
- //创建浏览器
- HttpClient httpClient = HttpClients.createDefault();
- String html = null;
- //预防网址链接中包含特殊字符,将url转为uri
- URL url = new URL(strURL);
- URI uri = new URI(url.getProtocol(), url.getHost(), url.getPath(),
- url.getQuery(), null);
- //使用POST方式
- HttpPost request = new HttpPost(uri);
- //将参数封装进UrlEncodedFormEntity中
- UrlEncodedFormEntity entity = new UrlEncodedFormEntity(params);
- request.setEntity(entity);
- HttpResponse response;
- try {
- //连接网址获取返回的数据
- response = httpClient.execute(request);
- //将返回的数据按照gbk的方式编码
- html = EntityUtils.toString(response.getEntity(), "GBK");
- } catch (IOException e) {
- e.printStackTrace();
- }
- //断开连接
- request.abort();
- //返回网址所发挥的html数据
- return html;
- }
其中,参数params的封装可以参照以下方式:
- List<NameValuePair> params = new ArrayList<NameValuePair>();
- //以键值对的方式存储
- params.add(new BasicNameValuePair("format", "hitcount"));
使用GET与POST方式获取html数据的更多相关文章
- Http方式获取网络数据
通过以下代码可以根据网址获取网页的html数据,安卓中获取网络数据的时候会用到,而且会用Java中的sax方式解析获取到数据.(sax解析主要是解析xml)具体代码如下: package com.wy ...
- 基于uFUN开发板的心率计(一)DMA方式获取传感器数据
前言 从3月8号收到板子,到今天算起来,uFUN到手也有两周的时间了,最近利用下班后的时间,做了个心率计,从单片机程序到上位机开发,到现在为止完成的差不多了,实现很简单,uFUN开发板外加一个Puls ...
- IOS开发之Post 方式获取服务器数据
//1.创建post方式的 参数字符串url +(NSString *)createPostURL:(NSMutableDictionary *)params { NSString *postStri ...
- [NSURLSession/Delegate]用Post方式获取网络数据并把数据显示到表格
#pragma mark 实现NSURLSessionDataDelegate代理 @interface ViewController ()<UITableViewDataSource,UITa ...
- [NSURLConnection]分别用Post和Get方式获取网络数据并把数据显示到表格
@interface ViewController ()<UITableViewDataSource,UITableViewDelegate> { UIButton* getButton; ...
- 用 get 同步/异步 方式获取网络数据并输出
//同步请求 //创建NSString用来存储请求的网址 NSString* str=@"http://v.juhe.cn/weather/index?format=2&cityna ...
- jQuery AJAX获取JSON数据解析多种方式示例
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
- J2EE Web开发入门—通过action是以传统方式返回JSON数据
关键字:maven.m2eclipse.JSON.Struts2.Log4j2.tomcat.jdk7.Config Browser Plugin Created by Bob 20131031 l ...
- android—获取网络数据
取网络数据主要靠发交易(或者说请求,接口等),而这些交易由java中的网络通信,HttpURLConnection和HttpClient实现,以下是具体例子. 大家都知道,网络通信,发送请求有两种 ...
随机推荐
- ubuntu下恢复被rm删除的文件
ubuntu是文件系统,不像windows系统划分盘符(C/D/E/etc...盘).ubuntu对磁盘划分分区,可以使用extundelete恢复ext3/ext4格式的磁盘分区. 其中,ext3/ ...
- VS Code报错Module 'xx' has no 'xx' member pylint(no-member)解决办法
pylint是vscode的python语法检查器,pylint是静态检查,在用第三方库的时候有些成员只有在运行代码的时候才会被建立,它就找不到成员,在设置(settings.json)里添加 &qu ...
- SQL语法——Join详解
一.INNER JOIN 用法: select column_name(s) from table 1 INNER JOIN table 2 ON table 1.column_name=table ...
- Oracle-分配用户只读存储过程权限
系统新来了系统运维人员,要求创建数据库账号,只分配对表,视图,存储程序有只读权限 因为表和视图权限接触比较频繁,所以今天花点时间整理下关于存储过程的权限 关于ORACLE账号的权限问题,一般分为两种权 ...
- sqli-labs(12)
0X01摘要体现(小编这里傻逼了 可以直接用group_concat函数绕过显示问题我还在用limit绕过) 还是这个模块 我们很熟徐那么先来尝试一下 单引号加入 无报错信息 哦豁 加入双引号试试呐 ...
- [CSP-S模拟测试]:邻面合并(状压DP)
题目背景 $NEWorld$作为一个$3D$游戏,对渲染(图形绘制)的效率要求极高.当玩家扩大视野范围时,可见的方块面数量将会迅速增多,以至于大量的顶点处理很快就成为了图形管线中的瓶颈.乔猫想了想,决 ...
- C/C++题库
1.下面的代码输出什么?为什么? void foo(void) { unsigned int a = 6; int b = -20; (a+b > 6)?puts(“>6”):puts(“ ...
- 洛谷P2023 [AHOI2009]维护序列(线段树区间更新,区间查询)
洛谷P2023 [AHOI2009]维护序列 区间修改 当我们要修改一个区间时,要保证 \(ax+b\) 的形式,即先乘后加的形式.当将区间乘以一个数 \(k\) 时,原来的区间和为 \(ax+b\) ...
- NDK undefined reference to 'rand'
NDK 编译 结果报错undefined reference to 'rand' 最怪异的是armeabi-v7a armeabi的情况下有问题 但是arm64-v8a编译正常,用网上说的添加头文件s ...
- mappers:将sql映射注册到全局配置中
<!-- 将我们写好的sql映射文件(EmployeeMapper.xml)一定要注册到全局配置文件(mybatis-config.xml)中 --> <!-- 6.mappers: ...