Scala入门到精通——第二十七节 Scala操纵XML
本节主要内容
- XML 字面量
- XML内容提取
- XML对象序列化及反序列化
- XML文件读取与保存
- XML模式匹配
1. XML 字面量
XML是一种很重要的半结构化数据表示方式,眼下大量的应用依赖于XML。这些应用或利用XML作为数据交换格式。或利用XML进行文件配置等。像JAVA、C++及其他流行的程序开发语言都是依赖于第三方库来实现XML的操作,比如JAVA常常通过JDOM,DOM4J等XML处理工具进行XML的操纵,但Scala提供了对XML的原生支持,通过scala.xml._包下的类或对象能够进行不论什么的XML操作。以下的代码演示了Scala中怎样定义XML字面量。
scala> var x: scala.xml.Elem = <site><name>xuetuwuyou</name><url>http://www.xuet
uwuyou.com/</url></site>
x: scala.xml.Elem = <site><name>xuetuwuyou</name><url>http://www.xuetuwuyou.com/
</url></site>
scala> <site><name>xuetuwuyou</name><url>http://www.xuetuwuyou.com/</url></site>
res8: scala.xml.Elem = <site><name>xuetuwuyou</name><url>http://www.xuetuwuyou.c
om/</url></site>
通过上面的代码不能发现,scala会自己主动地对XML进行解析。并识别为scala.xml.Elem类型。scala中与XML相关的包和类很多。详细例如以下图所看到的:
在深入解说Scala操纵XML之前,先对几个基本的术语进行介绍:
图中描写叙述了属性、根元素、子元素、元素及文本的概念及它们之间的关联关系,所以的文本、元素被统称为节点(Node)。以下给出的scala XML中的几个重要的类:
- Node类。它的一个抽象类。用于对象XML中的全部节点进行抽象:
- Text类,仅包括文本的节点,比如
<url>http://www.xuetuwuyou.com/</url>
中的http://www.xuetuwuyou.com/就是一种Text对象 - NodeSeq类,它相同是一个抽象类,指的是节点的序列,Node继承自NodeSeq,能够看Node可作是NodeSeq仅仅有一个元素的情况。
scala中的XML中能够运行scala表达式,比如
val s="http://www.xuetuwuyou.com/"
val xmlUrl= <a>{" "+s+" "}</a>
//<a> http://www.xuetuwuyou.com/ </a>
println(xmlUrl)
val age=30
val xml1= if(age<29) <age> {age} </age> else NodeSeq.Empty
//<age> 28 </age
println(xml1)
//<age> 79 </age>
val xml2= <age> {29+50} </age>
println(xml2)
2. XML内容提取
提取XML中的文本:
object ExtractXMLText extends App{
val x= <person><name>摇摆少年梦</name><age>27</age></person>
//摇摆少年梦27
println(x.text)
}
这样的提取方式将XML中全部的文本内容提取出来并拼接在一起,在实际中我们可能须要精确提取,比方我仅仅想提取name元素中的内容,此时能够採用下列方式:
val x= <person><name>摇摆少年梦</name><age>27</age></person>
//提取name子结点,类型XPATH訪问方式
//<name>摇摆少年梦</name>
println(x \ "name")
//提取name中的文本
println((x \ "name").text)
scala> x \ "age"
res2: scala.xml.NodeSeq = NodeSeq(<age>27</age>)
x \ “age” 这样的子元素的提取方式,返回的类型是scala.xml.NodeSeq
\的方式仅仅能提取子元素,不能提取子元素的子元素,比如:
val x= <persons>
<person><name>摇摆少年梦</name><age>27</age></person>
<person><name>张三</name><age>29</age></person>
<person><name>李四</name><age>30</age></person>
</persons>
//返回空NodeSeq
println(x \ "name")
// \\提取二级子元素
//<name>摇摆少年梦</name><name>张三</name><name>李四</name>
println(x \\ "name")
通过\和\能够提取不论什么XML的子元素及其文本内容,但假设XML元素带有属性。那又怎样提取呢?
val x= <persons>
<person
name="摇摆少年梦" age="27" />
<person><name>张三</name><age>29</age></person>
<person><name>李四</name><age>30</age></person>
</persons>
//用@方式提取name属性
//摇摆少年梦
println(x \\ "@name")
3. XML对象序列化及反序列化
以下给出的是对象的XML序列化操作:
class Person(val name:String,val age:Int){
def toXML()={
<person>
<name>{name}</name>
<age>{age}</age>
</person>
}
}
object XMLSerialization extends App{
val p=new Person("摇摆少年梦",27)
println(p.toXML())
}
反序列化操作:
class Person(val name:String,val age:Int){
//序列化操作
def toXML()={
<person>
<name>{name}</name>
<age>{age}</age>
</person>
}
//反序列化操作
def fromXML(xml:scala.xml.Elem):Person={
new Person((xml \ "name").text,(xml \ "age").text.toInt)
}
override def toString()="name="+name+", age="+age
}
object XMLSerialization extends App{
val p=new Person("摇摆少年梦",27)
val xmlPerson=p.toXML()
val p2=p.fromXML(xmlPerson)
println(p2)
}
4. XML文件读取与保存
前一小节,我们的序列化与反序列化操作都在内存中进行的,在通常的情况下都是将序列化后的XML保存在文件其中,在反序列化时再从文件里读取,实现方式例如以下:
class Person(val name:String,val age:Int){
def toXML()={
<person>
<name>{name}</name>
<age>{age}</age>
</person>
}
def fromXML(xml:scala.xml.Elem):Person={
new Person((xml \ "name").text,(xml \ "age").text.toInt)
}
override def toString()="name="+name+", age="+age
}
object XMLSerialization extends App{
val p=new Person("摇摆少年梦",27)
val xmlPerson=p.toXML()
//保存到XML文件其中
scala.xml.XML.save("person.xml", xmlPerson, "UTF-8", true, null)
//从文件里载入XML文件
val loadPerson=scala.xml.XML.loadFile("person.xml")
val p2=p.fromXML(loadPerson)
println(p2)
}
以下给出的是save方法的标签
/** Saves a node to a file with given filename using given encoding
* optionally with xmldecl and doctype declaration.
*
* @param filename the filename
* @param node the xml node we want to write
* @param enc encoding to use
* @param xmlDecl if true, write xml declaration
* @param doctype if not null, write doctype declaration
*/
final def save(
filename: String,
node: Node,
enc: String = encoding,
xmlDecl: Boolean = false,
doctype: dtd.DocType = null
): Unit =
5. XML模式匹配
Scala操纵XML另外一个很强大的地方在于,它能够用于模式匹配,从而很灵活、方便地对XML进行处理:
import scala.xml._
object PatternMatchingXML extends App{
def xmlMatching(node:Node)={
node match {
//XML模式匹配语法,利用{}进行匹配
case <persons>{sub_element}</persons>=> println(sub_element)
//其他未匹配的情况
case _ => println("no matching")
}
}
//以下这条语句的运行结果:<person><name>摇摆少年梦</name></person>
xmlMatching(<persons><person><name>摇摆少年梦</name></person></persons>)
//以下这条语句的运行结果:
//no matching
xmlMatching(<persons><person><name>摇摆少年梦</name></person><person><name>摇摆少年梦</name></person></persons>)
}
从上述代码能够看到,<persons>{sub_element}</persons>
仅仅能匹配标签<persons></persons>
中仅仅存在单个子元素的情况,假设具有多个子元素。即子元素构成NodeSeq,则不能匹配。须要进行进一步处理,代码例如以下:
object PatternMatchingXML extends App{
def xmlMatching(node:Node)={
node match {
//_*的方式表示能够匹配多个子元素的情况,假设匹配
//则将匹配的内容赋值给sub_element
case <persons>{sub_element @ _*}</persons>=> println(sub_element)
case _ => println("no matching")
}
}
//以下这条语句返回的是:ArrayBuffer(<person><name>摇摆少年梦</name></person>)
//数组中的每一个元素都是Node类型
xmlMatching(<persons><person><name>摇摆少年梦</name></person></persons>)
//以下这条语句返回的是:ArrayBuffer(<person><name>摇摆少年梦</name></person>, <person><name>摇摆少年梦</name></person>)
//数组中的每一个元素都是Node类型
xmlMatching(<persons><person><name>摇摆少年梦</name></person><person><name>摇摆少年梦</name></person></persons>)
}
由于返回的是ArrayBuffer,能够通过for循环遍历对XML子元素中的内容进行提取。如:
def xmlMatching2(node:Node)={
node match {
case <persons>{sub_element @ _*}</persons>=>
for(elm <- sub_element) println("getting "+(elm \ "name").text)
case _ => println("no matching")
}
}
//返回结果getting 摇摆少年梦
xmlMatching2(<persons><person><name>摇摆少年梦</name></person></persons>)
//返回结果:
//getting 摇摆少年梦
//getting 摇摆少年梦
xmlMatching2(<persons><person><name>摇摆少年梦</name></person><person><name>摇摆少年梦</name></person></persons>)
加入公众微信号。能够了解很多其他最新Spark、Scala相关技术资讯
Scala入门到精通——第二十七节 Scala操纵XML的更多相关文章
- Scala入门到精通——第二十四节 高级类型 (三)
作者:摆摆少年梦 视频地址:http://blog.csdn.net/wsscy2004/article/details/38440247 本节主要内容 Type Specialization Man ...
- Scala入门到精通——第二十九节 Scala数据库编程
本节主要内容 Scala Mavenproject的创建 Scala JDBC方式訪问MySQL Slick简单介绍 Slick数据库编程实战 SQL与Slick相互转换 本课程在多数内容是在官方教程 ...
- Scala入门到精通——第二十二节 高级类型 (一)
作者:摇摆少年梦 视频地址:http://www.xuetuwuyou.com/course/12 本节主要内容 this.type使用 类型投影 结构类型 复合类型 1. this.type使用 c ...
- Scala入门到精通
原文出自于: http://my.csdn.net/lovehuangjiaju 感谢! 也感谢,http://m.blog.csdn.net/article/details?id=52233484 ...
- Scala入门(1)Linux下Scala(2.12.1)安装
Scala入门(1)Linux下Scala(2.12.1)安装 一.文件准备 1.1 文件名称 scala-2.12.1.tgz 1.2 下载地址 http://www.scala-lang.org/ ...
- SaltStack 入门到精通第二篇:Salt-master配置文件详解
SaltStack 入门到精通第二篇:Salt-master配置文件详解 转自(coocla):http://blog.coocla.org/301.html 原本想要重新翻译salt-mas ...
- centos samba/squid 配置 samba配置 smbclient mount fstab自动挂载samba curl -xlocalhost:3128 www.qq.com squid配置 3128 DNSPOD 第二十七节课
centos samba/squid 配置 samba配置 smbclient mount fstab自动挂载samba curl -xlocalhost:3128 www.qq.com squ ...
- 风炫安全WEB安全学习第二十七节课 XSS的防御措施
风炫安全WEB安全学习第二十七节课 XSS的防御措施 XSS防御措施 总的原则 控制好输入/输出 过滤:根据业务需求进行过滤,对email,手机号码这样的输入框进行验证. 转义:所有输出到前端的数据都 ...
- Scala入门到精通——第十五节 Case Class与模式匹配(二)
本节主要内容 模式匹配的类型 for控制结构中的模式匹配 option类型模式匹配 1. 模式的类型 1 常量模式 object ConstantPattern{ def main(args: Arr ...
随机推荐
- C/S与B/S架构比较
一C/S 1.C/S概念 C/S是Client/Server的缩写.服务器通常采用高性能的PC.工作站或小型机,并采用大型数据库系统,如Oracle.Sybase.Informix或 SQL Serv ...
- Android通过startService播放背景音乐简单演示样例
关于startService的基本使用概述及其生命周期可參见博客<Android中startService的使用及Service生命周期>. 本文通过播放背景音乐的简单演示样例,演示sta ...
- Altium Designer如何删除以布的线
- jemter--录制的脚本设置循环次数不起作用
以下是比较jmeter线程组中设置循环次数和循环控制器中设置循环次数的区别 1.jmeter生成的脚本没有step1(循环控制器)控制器,故循环在线程组中设置 2.badboy录制的脚本有setp ...
- UML学习总结(1)——UML学习入门
随着亲手接触的项目越来越多,项目的复杂度越来越大,项目的理解程度也变的很难,尤其是在接收一个别人已经做好的项目时,你迫切先想到的就是"有没有文档啊",当然是各种文档,概要设计文档, ...
- 11.1 Android显示系统框架_framebuffer原理及改进
1. Android显示系统框架Android Graphic UI with GPU Hardware Accelerationhttps://community.nxp.com/docs/DOC- ...
- 使用前端后台管理模板库admin-lte(转)
使用前端后台管理模板库admin-lte 使用前端后台管理模板库admin-lte 安装 搭建环境 安装 安装admin-lte,可以通过以下几种办法安装,下图是GitHub中admin-lte的主页 ...
- 使用SystemC进行硬件仿真
使用SystemC进行硬件仿真 环境 linux-x86-64 bash g++ 下载解压SystemC SystemC下载地址 解压下载的包 tar zxvf systemc-2.3.3.tar.g ...
- 可视化格式模型(visual formatting model)
原文 简书原文:https://www.jianshu.com/p/7632f16ff555 大纲 1.认识可视化模型 2.可视化模型的内容 3.可视化模型的影响因素 1.认识可视化模型 盒子模型是C ...
- springboot(十四):springboot整合shiro-登录认证和权限管理(转)
springboot(十四):springboot整合shiro-登录认证和权限管理 .embody{ padding:10px 10px 10px; margin:0 -20px; border-b ...