xPath技术

1 引入

问题：当使用dom4j查询比较深的层次结构的节点（标签，属性，文本），比较麻烦！！！

2 xPath作用

主要是用于快速获取所需的节点对象。

3 在dom4j中如何使用xPath技术

1）导入xPath支持jar包。 jaxen-1.1-beta-6.jar

2）使用xpath方法

List<Node> selectNodes("xpath表达式"); 查询多个节点对象

Node selectSingleNode("xpath表达式"); 查询一个节点对象

4 xPath语法

/ 绝对路径表示从xml的根位置开始或子元素（一个层次结构）

// 相对路径表示不分任何层次结构的选择元素。

* 通配符表示匹配所有元素

[] 条件表示选择什么条件下的元素

@ 属性表示选择属性节点

and 关系表示条件的与关系（等价于&&）

text() 文本表示选择文本内容

代码练习：

package com.dom4j.xpath;

import java.io.File;

import java.util.List;

import org.dom4j.Document;

import org.dom4j.Node;

import org.dom4j.io.SAXReader;

public class xpathExercise {

    public static void main(String[] args) throws Exception {

        Document doc = new SAXReader().read(new File("./src/contact.xml"));

        String xpath = "";

        xpath = "/contactList";

        xpath = "//contact/name";

        xpath = "//name";

        xpath = "/*/*/age";

        xpath = "/contactList/*";

        xpath = "/contactList//*";

        xpath = "//contact[@value]";

        xpath = "//contact[@id]";

        xpath = "//contact[2]";

        xpath = "//contact[last()]";

        xpath = "//@id";

        xpath = "//contact[not(@id)]";

        xpath = "//contact[@id='003' and @value='hello']";

        xpath = "//name/text()";//返回ext

        xpath = "//contact/name[text()='张三']";

        List<Node> list = doc.selectNodes(xpath);

        for(Node node : list){

            System.out.println(node);

        }

    }

}

5 案例

用户登录功能：

用户输入用户名和密码 -> 到“数据库”查询是否有对应的用户 ->

有：则表示登录成功

没有：则表示登录失败

用xml当做数据库

user.xml 用来存储用户的数据

练习代码：

package com.xpath.example;

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStreamReader;

import java.util.List;

import org.dom4j.Attribute;

import org.dom4j.Document;

import org.dom4j.Element;

import org.dom4j.Node;

import org.dom4j.io.SAXReader;

public class userLogin {

    public static void main(String[] args) throws Exception {

        BufferedReader reader = new BufferedReader(new InputStreamReader(System.in));

        System.out.println("请输入用户名：");

        String user = reader.readLine();

        System.out.println("请输入密码： ");

        String pwd = reader.readLine();

        Document doc = new SAXReader().read("./src/user.xml");

        /*

        String xpath = "/users/user";

        List<Node> list = doc.selectNodes(xpath);

        String id, name, passwd;

        for(Node node : list){

            Element auser = (Element)node;

            id = auser.attribute("id").getValue();

            name = auser.attribute("name").getValue();

            passwd = auser.attribute("password").getValue();

            if(name.equals(user) && passwd.equals(pwd)){

                System.out.println(id + "在数据库中");

            }

        }

        */

        Element userElement = (Element)doc.selectSingleNode("//user[@name='" + user +"' and @password='" + pwd +"']");

        if(userElement == null){

            System.out.println("登录失败");

        }else{

            System.out.println("登录成功");

        }

    }

}

练习：读取一个html中的用户信息

person.html:

<html>

    <head>

        <title>传智播客1月18号班通讯录</title>

        <meta http-equiv="content-type" content="text/html; charset=UTF-8" />

    </head>

    <body>

        <center><h1>12月16号就业班通讯录</h1></center>

        <table border="1" align="center" id="contactForm">

            <thead>

                <tr><th>编号</th><th>姓名</th><th>性别</th><th>年龄</th><th>地址</th><th>电话</th></tr>

            </thead>

            <tbody>

                <tr>

                <td>001</td>

                <td>张三</td>

                <td>男</td>

                <td>18</td>

                <td>广州市天河区</td>

                <td>134000000000</td>

                </tr>

                <tr>

                <td>002</td>

                <td>李四</td>

                <td>女</td>

                <td>20</td>

                <td>广州市越秀区</td>

                <td>13888888888</td>

                </tr>

                <tr>

                <td>002</td>

                <td>郭靖</td>

                <td>男</td>

                <td>30</td>

                <td>广州市番禺区</td>

                <td>1342214321</td>

                </tr>

            </tbody>

        </table>

    </body>

</html>

person类：

package com.xpath.example;

public class Person {

    private String id;

    private String name;

    private String age;

    public String getAge() {

        return age;

    }

    public void setAge(String age) {

        this.age = age;

    }

    private String sex;

    private String addr;

    private String phone;

    public String getId() {

        return id;

    }

    public void setId(String id) {

        this.id = id;

    }

    public String getName() {

        return name;

    }

    public void setName(String name) {

        this.name = name;

    }

    public String getSex() {

        return sex;

    }

    public void setSex(String sex) {

        this.sex = sex;

    }

    public String getAddr() {

        return addr;

    }

    public void setAddr(String addr) {

        this.addr = addr;

    }

    public String getPhone() {

        return phone;

    }

    public void setPhone(String phone) {

        this.phone = phone;

    }

    @Override

    public String toString() {

        return "Person \n id=" + id + ", name=" + name + ", age=" + age + ", sex=" + sex

                + ", addr=" + addr + ", phone=" + phone + "\n";

    }

}

读取html写入person的主类：

package com.xpath.example;

import java.io.File;

import java.util.List;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

public class read_html {

    public static void main(String[] args) throws Exception {

        Document doc = new SAXReader().read(new File("./src/personList.html"));

        List nodes = doc.selectNodes("//tr");

    //    System.out.println(nodes);

        int num = nodes.size();

        Person[] persons = new Person[num];

        Element trNode;

        for(int i = 1; i < num; i++){

            persons[i] = new Person();

            trNode = (Element)nodes.get(i);

            //System.out.println(trNode.selectSingleNode("td[1]"));

            persons[i].setId(trNode.selectSingleNode("td[1]").getText());

            persons[i].setName(((Element)trNode.elements().get(1)).getText());

            persons[i].setSex(((Element)trNode.elements().get(2)).getText());

            persons[i].setAge(((Element)trNode.elements().get(3)).getText());

            persons[i].setAddr(((Element)trNode.elements().get(4)).getText());

            persons[i].setPhone(((Element)trNode.elements().get(5)).getText());

            System.out.println(persons[i]);

        }

    }

}

XPath详解的更多相关文章

DOM4J介绍与代码示例(2)-XPath 详解
XPath 详解,总结 XPath简介 XPath是W3C的一个标准.它最主要的目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计.目前有XPath1.0和 XPath2.0两个版本.其 ...
网页元素定位神器之Xpath详解
摘要: 经常在工作中会使用到XPath的相关知识,但每次总会在一些关键的地方不记得或不太清楚,所以免不了每次总要查一些零碎的知识,感觉即很烦又浪费时间,所以对XPath归纳及总结一下. ... ...
XPath 详解,总结
XPath简介 XPath是W3C的一个标准.它最主要的目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计.目前有XPath1.0和XPath2.0两个版本.其中Xpath1.0是199 ...
定位页面元素之xpath详解以及定位不到测试元素的常见问题
一.定位元素的方法 id:首选的识别属性,W3C标准推荐为页面每一个元素设置一个独一无二的ID属性, 如果没有且很难找到唯一属性,解决方法:(1)找开发把id或者name加上.如果不行,解决思路可以是 ...
爬虫之Xpath详解
XPath介绍 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 ...
python应用：爬虫框架Scrapy系统学习第一篇——xpath详解
HTML的三大概念:标签.元素以及属性标签:尖括号中的文本例:<head>……</head> 标签通常成对出现元素:标签中的所有内容元素中可包 ...
C#解析XML详解（XPath以及带命名空间NameSpace）
<?xml version="1.0" encoding="utf-8" ?> <bookstore> <book> < ...
xpath定位方法详解
1.xpath较复杂的定位方法: 现在要引用id为“J_password”的input元素,可以像下面这样写: WebElement password = driver.findElement(By. ...
selenium+Java,xpath定位方法详解（搬运留存）
用xpath绝对路径比较费事费力,还容易报错,下面几种模糊定位比较灵活好用 driver.findElement(By.xpath("//*[@id='J_login_form']/dl/d ...

随机推荐

最全SpringMVC具体演示样例实战教程
一.SpringMVC基础入门,创建一个HelloWorld程序 1.首先.导入SpringMVC须要的jar包. 2.加入Web.xml配置文件里关于SpringMVC的配置 <!--conf ...
[Polymer] Custom Elements: Styling
Code: <dom-module id="business-card"> <template> <div class="card" ...
DES加解密算法Qt实现
算法解密qt加密table64bit [声明] (1) 本文源码大部分源码来自:DES算法代码.在此基础上,利用Qt编程进行了改写,实现了DES加解密算法,并添加了文件加解密功能.在此对署名为b ...
J2EE (十) 简洁的JSTL、EL
简介 JSTL(JSP Standard Tag Library ,JSP标准标签库)是一个不断完善的开放源代码的JSP标签库. 由四个定制标记库(core.format.xml 和 sql)和一对通 ...
大数据笔记10：大数据之Hadoop的MapReduce的原理
1. MapReduce(并行处理的框架) 思想:分而治之,一个大任务分解成多个小的子任务(map),并行执行后,合并结果(Reduce) (1)大任务分解成多个小任务,这个过程就是map: (2)多 ...
AgileEAS.NET SOA中间件平台/敏捷软件开发平台 and SQL详解
AgileEAS.NET SOA中间件平台/敏捷软件开发平台 http://www.smarteas.net/ SQL详解: http://www.w3school.com.cn/sql/func_d ...
AlwaysON同步过程
<SQL Server 2012实施与管理实战指南>中指AlwaysON同步过程如下: 任何一个SQL Server里都有个叫Log Writer的线程,当任何一个SQL用户提交一个数据修 ...
让 asp.net mvc 支持带有+ _ 等特殊字符的路由
最近配置微信业务域名时,需要在服务器的根目录中上传一个文本文件,而这个文本文件需要放这样的目录中: 于在就在服务器目录中创建了对应的文件夹,并将kuPv.txt上传,但是访问时,却怎么也访问不到 ...
[Leetcode][020] Valid Parentheses (Java)
题目在这里: https://leetcode.com/problems/valid-parentheses/ [标签]Stack; String [个人分析]这个题应该算是Stack的经典应用.先进 ...
android手电筒开发
最近学习android开发,记录学习过程,分享一写小案例一. 如下先设置好布局文件 <TextView android:id="@+id/textView1" androi ...

XPath详解