初试Scala解析XML

使用Scala解析XML，充分体现了函数式编程的特点，简洁和明了。用Java去解析不是不行，只不过代码不够清晰明了。

首先先把XML文件读入到内存里:

val someXml = XML.loadFile("file/FIXExample.xml")

这样someXml是一个scala.xml.Elem对象。

Scala XML API提供了类似XPath的语法来解析XML。在NodeSeq这类父类里，定义了两个很重要的操作符("\"和"\\")，用来获得解析XML：

\ ：Projection function, which returns elements of this sequence based on the string that--简单来说，\ 根据条件搜索下一子节点
\\：Projection function, which returns elements of this sequence and of all its subsequences, based on the string that--而 \\ 则是根据条件搜索所有的子节点

先上一个XML的文件作为例子：

<fix major="4" minor="2">

  <header>

    <field name="BeginString" required="Y">FIX4.2</field>

    <field name="MsgType" required="Y">Test</field>

  </header>

  <trailer>

    <field name="Signature" required="N"/>

    <field name="CheckSum" required="Y"/>

  </trailer>

  <messages>

    <message name="Logon" msgtype="A" msgcat="admin">

      <field name="ResetSeqNumFlag" required="N"/>

      <field name="MaxMessageSize" required="N"/>

      <group name="NoMsgTypes" required="N">

        <field name="RefMsgType" required="N"/>

        <field name="MsgDirection" required="N"/>

      </group>

    </message>

    <message name="ResendRequest" msgtype="2" msgcat="admin">

      <field name="BeginSeqNo" required="Y"/>

      <field name="EndSeqNo" required="Y"/>

    </message>

  </messages>

  <fields>

    <field number="1" name="TradingEntityId" type="STRING"/>

    <field number="4" name="AdvSide" type="STRING">

      <value enum="X" description="CROSS"/>

      <value enum="T" description="TRADE"/>

    </field>

    <field number="5" name="AdvTransType" type="STRING">

      <value enum="N" description="NEW"/>

    </field>

  </fields>

</fix>

1. 首先来个简单的，如果要找header下的field，那么这样写即可：

val headerField = someXml\"header"\"field"

2.找所有的field：

val field = someXml\\"field"

3. 找特定的属性(attribute)，如找header下的所有field的name属性的值：

val fieldAttributes = (someXml\"header"\"field").map(_\"@name")

val fieldAttributes = someXml\"header"\"field"\\"@name"

两个都能找到header下面所有field的name属性，但问题是输出的格式不一样。前者会返回一个List-List(BeginString, MsgType)，而后者仅仅是BeginStringMsgType。中间连空格也没有。所以建议用前一种方法获得属性。

之前以为，下面的方法，和第二种方法一样能够获得属性的值：

val fieldAttributes = someXml\"header"\"field"\"@name"

根据\操作符的定义，理论上应该可以输出name属性的。实际上输出的结果是空，什么也没有。

\操作符的源码里有这么一段：

    that match {

      case ""                                         => fail

      case "_"                                        => makeSeq(!_.isAtom)

      case _ if (that() == '@' && this.length == )  => atResult

      case _                                          => makeSeq(_.label == that)

    }

第三个case表面，只有当this.length==1时，才可以这样做。原因其实很简单，somXml\"header"\"field"返回的是一个Seq[Node]的集合，包含多个对象。而\"@"的操作无法确定操作哪一个对象的属性：

  val x = <b><h id="bla"/><h id="blub"/></b>

  val y = <b><h id="bla"/></b>

  println(x\\"h"\"@id") //Wrong

  println(y\\"h"\"@id") //Correct with output: bla

4. 查找并输出属性值和节点值的映射：

(someXml\"header"\"field").map(n=>(n\"@name", n.text, n\"@required"))

这样的输出是List((BeginString,FIX4.2,Y), (MsgType,Test,Y))

5. 有条件地查找节点，例如查找name=Logon的message：

val resultXml1 = (someXml\\"message").filter(_.attribute("name").exists(_.text.equals("Logon")))

val resultXml2 = (someXml\\"message").filter(x=>((x\"@name").text)=="Logon")

6. 通过 \\"_" 获得所有的子节点，例如：

println(resultXml1\\"_")

结果是：

<message msgcat="admin" msgtype="A" name="Logon">

      <field required="N" name="ResetSeqNumFlag"/>

      <field required="N" name="MaxMessageSize"/>

      <group required="N" name="NoMsgTypes">

        <field required="N" name="RefMsgType"/>

        <field required="N" name="MsgDirection"/>

      </group>

</message>

<field required="N" name="ResetSeqNumFlag"/>

<field required="N" name="MaxMessageSize"/>

<group required="N" name="NoMsgTypes">

        <field required="N" name="RefMsgType"/>

        <field required="N" name="MsgDirection"/>

</group>

<field required="N" name="RefMsgType"/>

<field required="N" name="MsgDirection"/>

本文完

初试Scala解析XML的更多相关文章

Scala入门到精通——第二十七节 Scala操纵XML
本节主要内容 XML 字面量 XML内容提取 XML对象序列化及反序列化 XML文件读取与保存 XML模式匹配 1. XML 字面量 XML是一种很重要的半结构化数据表示方式,眼下大量的应用依赖于XM ...
Android 解析XML文件和生成XML文件
解析XML文件 public static void initXML(Context context) { //can't create in /data/media/0 because permis ...
Android之解析XML
1.XML:可扩展标记语言. 可扩展标记语言是一种很像超文本标记语言的标记语言. 它的设计宗旨是传输数据,而不是显示数据. 它的标记没有被预定义.需要自行定义标签. 它被设计为具有自我描述性. 是W3 ...
Android之Pull解析XML
一．Pull解析方法介绍除了可以使用SAX和DOM解析XML文件,也可以使用Android内置的Pull解析器解析XML文件.Pull解析器的运行方式与SAX解析器相似.它也是事件触发的.Pull解 ...
Android之DOM解析XML
一．DOM解析方法介绍 DOM是基于树形结构的节点或信息片段的集合,允许开发人员使用DOM API遍历XML树,检索所需数据.分析该结构通常需要加载整个文档和构造树形结构,然后才可以检索和更新节点信息 ...
Android之SAX解析XML
一．SAX解析方法介绍 SAX(Simple API for XML)是一个解析速度快并且占用内存少的XML解析器,非常适合用于Android等移动设备. SAX解析器是一种基于事件的解析器,事件驱动 ...
Android 使用pull,sax解析xml
pull解析xml文件 1.获得XmlpullParser类的引用这里有两种方法 //解析器工厂 XmlPullParserFactory factory=XmlPullParserFactory. ...
用 ElementTree 在 Python 中解析 XML
用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...
java解析xml的三种方法
java解析XML的三种方法 1.SAX事件解析 package com.wzh.sax; import org.xml.sax.Attributes; import org.xml.sax.SAXE ...

随机推荐

HTML思维导图
C#中==、Equals、ReferenceEquals的区别
原文链接:http://www.studyofnet.com/news/1188.html 本文导读: C#中Equals , == , ReferenceEquals都可以用于判断两个对象的个体是不 ...
钉钉js依赖库学习
看别人用的依赖库的好处在于,你知道有什么可以用,什么可以借鉴.(钉钉——协作桌面应用) PS:人最怕是不知道,而不是你不会. 1. jQuery 钉钉使用了1.9.1版本的jQuery,jQuery作 ...
深入JavaScript：词法分析、连续赋值猜想
JavaScript:词法分析.连续赋值猜想原创文章,转摘请注明出处:苏福:http://www.cnblogs.com/susufufu/p/5851642.html 深夜发文,先吐槽下博客园的编 ...
微信平台ASPX高级定制开发（一）：如何使用C#建立响应微信接入和自动回复的代码
微信平台不解释了,如果不了解的百度一下下,如果不会用微信,请自宫,光盘重启电脑,打开CMD输入Format C:.网上有很多针对企业级的高级定制ASPX开发,写得草草了事,很多男人干事都草草了事,这可 ...
Sharepoint学习笔记—习题系列--70-576习题解析 -(Q121-Q123)
Question 121 You are designing a SharePoint 2010 workflow that will be used to monitor invoices. Th ...
Android数据存储方式--SharedPreferences
Android数据存储方式有如下四种:SharedPreferences.存储到文件.SQLite数据库.内容提供者(Content provider).存储到网络服务器. 本文主要介绍一下Share ...
android 网络请求Ⅰ
本章讲述在android开发中,常用的网络请求操作.网络请求利用android基本的HttpURLConnection连接URL和开源网络请求包AsyncHttpClient.本次网络请求以调取天气接 ...
NSLog 占位符
转自:http://blog.sina.com.cn/s/blog_75f190280101dmj8.html [iOS]Objective-C占位符使用 (2013-10-21 10:24:16) ...
2015-SH项目总结
2015年,加入现在的公司(外包公司,名字就不说了),做SH项目(化名),在这个月(2016.01)结束了. 虽然公司也有做项目总结,不过我还是自己也总结一次. 项目概况: 这是个为一间私人会所提供全 ...

初试Scala解析XML

初试Scala解析XML的更多相关文章

随机推荐

热门专题