运行前先导入dom4j架包,由于我们公司用的代理服务器所以下面我设置了代理ip,不需要的可直接忽略

package com.chengshidaima.tools;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.InetSocketAddress;
import java.net.Proxy;
import java.net.URL;
import java.net.URLConnection;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element; public class CityCode
{ // private Logger log = Logger.getLogger(CityCode.class.getName()); public static void main(String[] args) {
try {
CityCode cc = new CityCode();
cc.getCityXml();
//System.out.println(doc.asXML());
} catch (Exception e) {
e.printStackTrace();
}
} /**
* 解析
*
* @return
* @throws Exception
*/
@SuppressWarnings("unchecked")
private Document getCityXml() throws Exception {
/** 新建一个doc 保存结果 */
Document docResult = DocumentHelper.createDocument();
Element addElementRoot = DocumentHelper.createElement("china"); String sUrlChina = "http://flash.weather.com.cn/wmaps/xml/china.xml";
String sChinaProvXml = getUrlString(sUrlChina);
Document doc = DocumentHelper.parseText(sChinaProvXml); Element rootElt = doc.getRootElement(); // 获取根节点
//log.info("根节点:" + rootElt.getName()); // 拿到根节点的名称
/** 取得所有省份 */
List<Element> listProv = rootElt.elements("city"); // 获取根节点下的子节点
for (int i = 0; i < listProv.size(); i++) {
Element elementProv = listProv.get(i);
/** 省份名字 */
String sProvName = elementProv.attributeValue("pyName");
String sProvNameCN = elementProv.attributeValue("quName");
/** 添加节点 */
Element addElementProv = DocumentHelper.createElement("prov");
addElementProv.addAttribute("pyName", sProvName);
addElementProv.addAttribute("quName", sProvNameCN); try {
//log.info("查询省份:" + sProvNameCN + " 下的城市!");
String sUrlProv = "http://flash.weather.com.cn/wmaps/xml/" + sProvName + ".xml";
String sProvXml = getUrlString(sUrlProv);
Document docProv = DocumentHelper.parseText(sProvXml); Element rootEltProv = docProv.getRootElement(); // 获取省份下的跟节点
List<Element> listCity1 = rootEltProv.elements("city");
for (int j = 0; j < listCity1.size(); j++) {
Element elementCity1 = listCity1.get(j);
String sCityName1 = elementCity1.attributeValue("pyName");
String sCityUrl1 = elementCity1.attributeValue("url");
String sCityNameCN1 = elementCity1.attributeValue("cityname");
System.out.println(sCityNameCN1 + ":" + sCityUrl1); Element addElementMainCity = DocumentHelper.createElement("city");
addElementMainCity.addAttribute("pyName", sCityName1);
addElementMainCity.addAttribute("quName", sCityNameCN1);
addElementMainCity.addAttribute("url", sCityUrl1); try {
String sUrlCity1 = "http://flash.weather.com.cn/wmaps/xml/" + sCityName1 + ".xml";
//log.info("查询主要城市:" + sCityNameCN1 + " 下的城市!");
String sCityXml = getUrlString(sUrlCity1);
Document docCity1 = DocumentHelper.parseText(sCityXml);
Element rootCity1 = docCity1.getRootElement();
List<Element> listCity2 = rootCity1.elements("city"); for (int k = 0; k < listCity2.size(); k++) {
Element elementCity2 = listCity2.get(k);
String sCityName2 = elementCity2.attributeValue("pyName");
String sCityNameCN2 = elementCity2.attributeValue("cityname");
String sCityUrl2 = elementCity2.attributeValue("url");
if (!sCityUrl1.endsWith(sCityUrl2)) {
System.out.println(sCityNameCN2 + ":" + sCityUrl2);
}
Element addElementCity2 = DocumentHelper.createElement("city2");
addElementCity2.addAttribute("pyName", sCityName2);
addElementCity2.addAttribute("quName", sCityNameCN2);
addElementCity2.addAttribute("url", sCityUrl2);
addElementMainCity.add(addElementCity2);
} } catch (Exception e) {
// log.info("查询主要城市:" + sCityNameCN1 + " 下的城市失败!");
}
addElementProv.add(addElementMainCity);
}
} catch (Exception e) {
//log.info("查询省份:" + sProvNameCN + "下的城市失败!");
}
addElementRoot.add(addElementProv);
}
docResult.setRootElement(addElementRoot);
return docResult;
} /**
* 从url获取xml字符串
*
* @param sUrl
* @return
* @throws Exception
*/
private String getUrlString(String sUrl) throws Exception {
String sResult = "";
StringBuffer sbResult = null;
// log.info("开始连接Url:" + sUrl);
sbResult = new StringBuffer();
URL url = new URL(sUrl); // 创建代理服务器
InetSocketAddress addr = new InetSocketAddress("10.128.6.3",808);
Proxy proxy = new Proxy(Proxy.Type.HTTP, addr); // http 代理 URLConnection con = url.openConnection(proxy);
BufferedReader br = new BufferedReader(new InputStreamReader(con.getInputStream(), "UTF-8"));
String sLine = null;
while ((sLine = br.readLine()) != null) {
sbResult.append(sLine);
}
sResult = sbResult.toString();
//log.info("获取到信息:" + sbResult.toString().substring(0, 500));
if (sResult.contains("html")) {
String sInt = "null";
Integer.parseInt(sInt);
}
return sResult;
}
}

 

运行部分结果如下图:

java解析XML获取城市代码的更多相关文章

  1. Java 解析 XML

    Java 解析 XML 标签: Java基础 XML解析技术有两种 DOM SAX DOM方式 根据XML的层级结构在内存中分配一个树形结构,把XML的标签,属性和文本等元素都封装成树的节点对象 优点 ...

  2. Java解析XML汇总(DOM/SAX/JDOM/DOM4j/XPath)

    [目录] 一.[基础知识——扫盲] 二.[DOM.SAX.JDOM.DOM4j简单使用介绍] 三.[性能测试] 四.[对比] 五.[小插曲XPath] 六.[补充] 关键字:Java解析xml.解析x ...

  3. 【Java】详解Java解析XML的四种方法

    XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML.本文将详细介绍用Java解析XML的四种方法. AD: XML现在已经成为一种通用的数据交换格式,它的平台无关性,语 ...

  4. java解析xml的几种方式

    java解析xml的几种方式 DOM DOM的全称是Document ObjectModel,也即文档对象模型.在应用程序中,基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合(通常称D ...

  5. Java解析word,获取文档中图片位置

    前言(背景介绍): Apache POI是Apache基金会下一个开源的项目,用来处理office系列的文档,能够创建和解析word.excel.ppt格式的文档. 其中对word文档的处理有两个技术 ...

  6. Java解析XML之Dom4j

    Java解析XML文件的方法有多种,个人感觉最常用的是使用Dom4j来解析XML文件.下面就简单介绍下Dom4j的基础使用. Dom4j需要jar包的支持,大家可以从网络上下载,如dom4j-1.6. ...

  7. JAVA解析XML之SAX方式

    JAVA解析XML之SAX方式 SAX解析xml步骤 通过SAXParseFactory的静态newInstance()方法获取SAXParserFactory实例factory 通过SAXParse ...

  8. JAVA解析XML之DOM方式

    JAVA解析XML之DOM方式 准备工作 创建DocumentBuilderFactory对象;    创建DocumentBuilder对象; 通过DocumentBuilder对象的parse方法 ...

  9. java解析xml汇总

    [目录] 一.[基础知识——扫盲] 二.[DOM.SAX.JDOM.DOM4j简单使用介绍] 三.[性能测试] 四.[对比] 五.[小插曲XPath] 六.[补充] 关键字:Java解析xml.解析x ...

随机推荐

  1. maven项目构建

    Maven是apache的一个开源项目.是一个用来把源代码构建成可发布的构件的工具. Maven的功能非常强大,可以认为是一个项目管理工具,不仅仅是一个构建工具. Maven本身的核心很小,但是可以在 ...

  2. JavaEE 配置文件 应用首选项存储

    JavaEE 配置文件 应用首选项存储 @author ixenos 什么是首选项? 首选项Preferences 指配置信息 首选项存储就是指对配置信息的存储   有什么方式存储? 有两种,一种存于 ...

  3. strings

    3.1.1.1 计算列表中的字符串数目 使用Count属性可计算列表中的字符串数目.Count是只读属性,用以指示列表中字符串列表数目.因为字符串列表是以零开始索引,因而Count比列表的最大索引数大 ...

  4. .net大型分布式电子商务架构说明(转载来自<头条>)

    背景 构建具备高可用,高扩展性,高性能,能承载高并发,大流量的分布式电子商务平台,支持用户,订单,采购,物流,配送,财务等多个项目的协作,便于后续运营报表,分析,便于运维及监控. 架构演变 基础框架剥 ...

  5. 在 iOS 应用中直接跳转到 AppStore 的方法

      找到应用程序的描述链接,在itunes中找到相应的应用,(如下图),点击免费右边的下方向键,选择复制链接,就拿到了对应的app的描述链接 比如:https://itunes.apple.com/c ...

  6. android listen

    android监听机制,应该是一种观察者模式. 摘抄网上教程,观察者模式的结构如下: 其中涉及的角色有: ● 抽象主题(Subject)角色:抽象主题角色把所有对观察者对象的引用保存在一个聚集(比如A ...

  7. erlang nif小结

    一.nif获取string参数的两种方式 1.eif_get_string 实例如下: static ERL_NIF_TERM erl_sm4_encrypt(ErlNifEnv* env, int ...

  8. sync命令

    sync命令用于强制被改变的内容立刻写入磁盘,更新超块信息. 在Linux/Unix系统中,在文件或数据处理过程中一般先放到内存缓冲区中,等到适当的时候再写入磁盘,以提高系统的运行效率.sync命令则 ...

  9. ACE_Message_Block消息数据类

    ACE_Message_Block ACE_Message_Block用于构建"固定"和"可变"长度的消息.ACE_Message_Block可以将多条消息连接 ...

  10. UVA 10480 Sabotage

    最小割+输出方案 #include<cstdio> #include<cstring> #include<string> #include<cmath> ...