java.net.URL类是对统一资源定位符(如http://www.lolcats.com)的抽象。它扩展了java.lang.Object,是一个final类。它采用策略模式,协议处理器(protocol handler)就是策略,URL类构成Context,通过它来选择不同的策略。

URL是一个字符串,但是对于URL类而言,这个字符串会被分解为URL类中的各个属性。URL类中的属性包括协议,主机名,端口,路径,查询字符串和片段标识。在构造了一个URL对象后其字段不再改变,所以URL是线程安全的。

构造URL对象

通过字符串构造URL对象

public URL(String url)

try {
URL u = new URL("http://www.xdysite.cn");
} catch (MalformedURLException e) {
System.out.println(e);
}

通过组成部分构造URL

pulbic URL(String protocol, String hostname, String file)

pulbic URL(String protocol, String hostname, int port String file)

try {
//采用默认端口构造
URL u1 = new URL("http", "www.xdysite.cn","/index.php");
//使用8000端口构造
URL u2 = new URL("http", "www.xdysite.cn", 8000, "/index.php");
} catch (MalformedURLException e) {
System.out.println();
}

构造相对URL

public URL(URL base, String relative)

try {
URL u1 = new URL("http://www.xdysite.cn/javafaq/index.xml");
URL u2 = new URL(u1, "mailinglists.html");
} catch (MalformedURLException e) {
System.out.println();
}

如果有一个基础的URL(http://www.xdysite.cn/javafaq/index.html),通过上述方式可以构造出一个新的URL(http://www.xdysite.cn/javafaq/mailinglists.html)

从URL获取数据


直接打开流来获取数据

public final InputStream openStream()

该方法会直接从URL指向的资源中获取数据,如果资源是HTML页面,那么会直接获取页面的数据。并不会获取关于HTTP头部的信息。

try {
URL u = new URL("http://www.xdysite.cn/index.php");
try(Reader r = new InputStreamReader(new BufferedInputStream(u.openStream()))){
int c;
while((c = r.read())!=-1){
System.out.print((char)c);
}
}
} catch (IOException e) {
System.out.println(e);
}

获取一个具体的对象

public final Object getContent()

该方法会获取URL指向的数据,并尝试建立某种类型的对象。如果URL指示某种文本(HTML/XML),返回的对象通常是某种InputStream。如果URL指示一个图像(如GIF或JPEG),getContent()通常会返回一个java.awt.ImageProducer。

try {
URL u = new URL("http://www.xdysite.cn/index.html");
try(Reader r = new InputStreamReader(new BufferedInputStream((InputStream)u.getContent()))){
int c;
while((c = r.read())!=-1){
System.out.print((char)c);
}
}
} catch (IOException e) {
System.out.println(e);
}

URL编码问题


由于在发明Web时Unicode编码还没有普及,使得URL中使用的字符必须来自于ASCII码中的一个固定的子集,确切的讲,包括:

  • 大写字母A-Z
  • 小写字母a-z
  • 数字0-9
  • 标点符号 – _ . ! ~ * ' ,
  • 特殊用途的字符 / & ? @ # ; $ + = %

    就目前的而言只有上面的字符才能出现在URL中.如果在URL中需要出现一些上面没有的字符时,需要对URL进行编码。

  • URLEncoder类

    可以使用该类对一个字符串进行编码,编码后会将将结果转为%和两个十六进制数。现在通用的编码机制是UTF-8

    try {
    System.out.println(URLEncoder.encode("This is a string", "UTF-8"));
    System.out.println(URLEncoder.encode("This/is/a/string", "UTF-8"));
    System.out.println(URLEncoder.encode("This\"is\"a\"string", "UTF-8"));
    System.out.println(URLEncoder.encode("This_is.a-string*", "UTF-8"));
    } catch (UnsupportedEncodingException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
    }

    过度编码

    在URL中允许出现的字符是不需要进行编码的。但是使用URL类时,会对斜线(/),与号(&),等号(=)进行编码。我们知道在URL中斜线(/)表示下一级目录。如果对其进行编码会导致我们无法访问资源。这就是过度编码问题。为了解决这个问题,我们需要逐步分对URL进行编码,而不是对整个URL进行编码。

    try {
    String query = URLEncoder.encode("http://www.baidu.com/s?wd=火影&sp=on", "UTF-8");
    System.out.println(query);
    } catch (UnsupportedEncodingException e) {
    e.printStackTrace();
    }

    输出结果

    我们看到URLEncoder对斜杠(/)都进行编码,这个不是我们想要的。我们只需要对“火影”进行编码即可。

    try {
    String query = "http://www.baidu.com/s?wd="+URLEncoder.encode("火影", "utf-8")+"&sp=on";
    System.out.println(query);
    } catch (UnsupportedEncodingException e) {
    e.printStackTrace();
    }

    输出结果

    由于使用UTF-8对“火影”进行编码后需要6个字节进行存储(每个汉字三个字节),所以显示出来是%E7%81%AB%E5%BD%B1,每个%后是一个字节,用十六进制表示。

    URL类的更多相关文章

    1. Java中的URL类

      Java的网络类可以让你通过网络或者远程连接来实现应用.而且,这个平台现在已经可 以对国际互联网以及URL资源进行访问了.Java的URL类可以让访问网络资源就像是访问你本地的文件夹一样方便快捷.我们 ...

    2. Java-->利用URL类下载图片

      --> 通过get 请求访问图片地址,将通过服务器响应的数据(即图片数据)存到本地文件中... --> HttpURLConnectionUtil 工具类 package com.drag ...

    3. java之URL类

      Java的网络类可以让你通过网络或者远程连接来实现应用.而且,这个平台现在已经可 以对国际互联网以及URL资源进行访问了.Java的URL类可以让访问网络资源就像是访问你本地的文件夹一样方便快捷.我们 ...

    4. Java URL类踩坑指南

      背景介绍 最近再做一个RSS阅读工具给自己用,其中一个环节是从服务器端获取一个包含了RSS源列表的json文件,再根据这个json文件下载.解析RSS内容.核心代码如下: class Presente ...

    5. MinerUrl.java 解析页面后存储URL类

      MinerUrl.java 解析页面后存储URL类 package com.iteye.injavawetrust.miner; /** * 解析页面后存储URL类 * @author InJavaW ...

    6. Java使用URL类下载的图片不完整

      问题 今天在使用URL类来下载网站中的图片的时候,出现了一个问题:下载的图片不完整,并且每次下载的图片大小也不是都相同,反正就是不完整. 问题代码如下: package cn.ganlixin.tes ...

    7. Java的URL类(二)

      转:https://www.cnblogs.com/brokencolor/p/8575440.html Java的URL类(二) 实例: Java 通过HttpURLConnection Post方 ...

    8. Java的URL类(一)

      转:https://www.cnblogs.com/blackiesong/p/6182038.html Java的URL类(一) Java的网络类可以让你通过网络或者远程连接来实现应用.而且,这个平 ...

    9. [19/04/14-星期日] 网络编程_java.net包(InetAddress类、InetSocketAddress类、URL类)

      一.概念 Java为了可移植性,不允许直接调用操作系统,而是由java.net包来提供网络功能.Java虚拟机负责提供与操作系统的实际连接. InetAddress    作用:封装计算机的IP地址和 ...

    随机推荐

    1. li进度条宽度和颜色按顺序显示的效果。

      实际项目中li和里边的数值是动态生成的,需要控制它的宽度和颜色,效果如图: 如果能实现颜色按数值规律变化就好了,目前颜色是固定到数组中的. 实例代码如下: <!DOCTYPE html>& ...

    2. Sass-也许你想和CSS玩耍起来(下篇)

      问心无愧,共勉! sass-也许你想和CSS玩耍起来(上篇) 上篇中主要介绍了一些sass的基本特性.下篇中,主要是写一些我们常用的sass控制命令,函数和规则. sass进阶 控制命令 可能看过上篇 ...

    3. 实现UITextView的placeholder

      我们知道在iOS开发时,控件UITextField有个placeholder属性,UITextField和UITextView使用方法基本类似,有两个小区别:1.UITextField单行输入,而UI ...

    4. Mac常用shell命令

      几个常用命令 pwd 命令名称:pwd 英文:print work directory 描述:查看当前工作目录的完整路径 ls 英文全称: list 描述:列出目录下的内容清单 常用参数: -l:列出 ...

    5. Android的四大组件之Activity

      Android的四大组件之Activity Activity:是Android组件中最基本也是最为常见用的四大组件(Activity,Service服务,Content Provider内容提供者,B ...

    6. Android measure过程分析

      作为一名Android开发人员,我们都知道一个View从无到有,会经历3个阶段: 1. measure/测量阶段,也就是确定某个view大小的过程: 2. layout/布局阶段,也就是确定其左上右下 ...

    7. IOS开发之Bug--遇到一个类型不确定的bug

      下面的问题不大,是我在开发中遇到的问题: 然后我就google搜一下这个报错 . 下面就解决了:

    8. Sublime Text 解决中文乱码

      sublime text 是一款非常优秀的跨平台文本及源代码编辑器,本人非常喜欢,但是不支持GB2312和GBK编码在某些时候比较麻烦.可以通过向sublime text 中添加编码类型转换包(比如& ...

    9. 《Windows IoT 应用开发指南》

      物物互联的时代已经到来,智能家居.智慧校园.智慧交通.可穿戴.无人机.全息投影,各种各样的新名词.黑科技层出不穷.当我们为五年前能够通过手机控制家电而欣喜若狂的时候,可曾憧憬过当前使用增强现实设备完成 ...

    10. .NET应用架构设计—用户端的防腐层作用及设计

      阅读目录: 1.背景介绍 2.SOA架构下的显示端架构腐化 3.有效使用防腐层来隔离碎片服务导致显示端逻辑腐烂 4.剥离服务调用的技术组件让其依赖接口 5.将服务的DTO与显示端的ViewModel之 ...