为什么针对XML的支持不够好?如何改进?

物理文件是我们最常用到的原始配置的载体,最佳的配置文件格式主要由三种,它们分别是JSON、XML和INI,对应的配置源类型分别是JsonConfigurationSource、XmlConfigurationSource和IniConfigurationSource。但是对于.NET Core的配置系统来说,我们习以为常的XML反倒不是理想的配置源,至少和JSON比较起来,它具有一个先天不足的劣势,那就是针对集合数据结构的支持不如人意。[ 本文已经同步到《ASP.NET Core框架揭秘》之中]

一、为什么针对集合的配置难以通过优雅的XML来表示

在《配置模型设计详解》一文中我们对配置模型的设计和实现进行了详细介绍。在此文中我们说应用中的配置体现为一种树形化的层次结构,所我将它称为“配置树”,具体的配置数据通过配置树的“叶子节点”承载。当配置数据从不同的来源加载之后都会转换成一个字典,我将其称为“配置字典”。为了让“配置字典”能够存储“配置树”的所有数据和自身结构,我们需要在配置字典中存储所有叶子节点,叶子节点的路径和值将直接作为字典元素的Key和Value。由于字典的Key是唯一的,这就要求配置树中的每一个节点必须具有唯一的路径。XmlConfigurationSource/XmlConfigurationProvider不能很好地支持集合数据结构的问题就出现在这里。

   1: public class Profile
   2: {
   3:     public Gender         Gender { get; set; }
   4:     public int            Age { get; set; }
   5:     public ContactInfo    ContactInfo { get; set; }
   6: }
   7:  
   8: public class ContactInfo
   9: {
  10:     public string EmailAddress { get; set; }
  11:     public string PhoneNo { get; set; }
  12: }
  13:  
  14: public enum Gender
  15: {
  16:     Male,
  17:     Female
  18: }

举个简单的例子,假设需要采用XML来表示一个Profile对象的集合(Profile的类型具有如上所示的定义),那么我们很自然地会采用如下的结构。

   1: <Profiles>
   2:   <Profile Gender="Male" Age="18">
   3:     <ContactInfo EmailAddress ="foobar@outlook.com" PhoneNo="123"/>
   4:   </Profile>
   5:   <Profile Gender="Male" Age="25">
   6:     <ContactInfo EmailAddress ="bar@outlook.com" PhoneNo="456"/>
   7:   </Profile>
   8:   <Profile Gender="Male" Age="40">
   9:     <ContactInfo EmailAddress ="baz@outlook.com" PhoneNo="789"/>
  10: </Profile>

对于这段XML结构,XmlConfigurationProvider会采用“简单粗暴”的方式将它映射为如下所示的“配置树”。由于这棵树直接将XML元素的名称作为配置节点名称,所以三个Profile对象在这棵树中的根节点都以“Profile”命名,毫无疑问,这颗树将不能使用字典来表示,因为它不能保证所有的节点都具有不同的路径。

二、按照配置树的要求对XML结构稍作转换

之所以XML不能像JSON格式那样可以以一种很自然的形式表示集合或者数组,是因为后者对这两种数据类型提供了明确的定义方式(采用中括号定义),但是XML只有子元素的概念,我们不能确定它的子元素是否是一个集合。如果做这样一个假设:如果同一个XML元素下的所有子元素都具有相同的名称,那么我们可以将其视为集合。根据这么一个假设,我们对XmlConfigurationSource略加改造就可以解决XML难以表示集合数据结构的问题。

我们通过派生XmlConfigurationSource创建一个新的ConfigurationSource类型,姑且将其命名为ExtendedXmlConfigurationSource。XmlConfigurationSource提供的ConfigurationProvdier类型为ExtendedXmlConfigurationProvider,它派生于XmlConfigurationProvider。在重写的Load方法中,ExtendedXmlConfigurationProvider通过对原始的XML结构进行相应的改动,从而让原本不合法的XML(XML元素具有相同的名称)可以转换成一个针对集合的配置字典 。下图展示了XML结构转换采用的规则和步骤。

如上图所示,针对集合对原始XML所作的结构转换由两个步骤组成。第一步为表示集合元素的XML元素添加一个名为“append_index”的属性(Attribute),我们采用零基索引作为该属性的值。第二步会根据第一步转换的结果创建一个新的XML,同名的集合元素(比如<profile>)将会根据添加的索引值从新命名(比如<profile_index_0>)。毫无疑问,转换后的这个XML可以很好地表示一个集合对象。如下所示的是ExtendedXmlConfigurationProvider的定义,上述的这个转换逻辑体现在重写的Load方法中。

   1: public class ExtendedXmlConfigurationProvider : XmlConfigurationProvider
   2: {
   3:    public ExtendedXmlConfigurationProvider(XmlConfigurationSource source) : base(source)
   4:     {}
   5:  
   6:     public override void Load(Stream stream)
   7:     {
   8:         //加载源文件并创建一个XmlDocument        
   9:         XmlDocument sourceDoc = new XmlDocument();
  10:         sourceDoc.Load(stream);
  11:  
  12:         //添加索引
  13:         this.AddIndexes(sourceDoc.DocumentElement);
  14:  
  15:         //根据添加的索引创建一个新的XmlDocument
  16:         XmlDocument newDoc = new XmlDocument();
  17:         XmlElement documentElement = newDoc.CreateElement(sourceDoc.DocumentElement.Name);
  18:         newDoc.AppendChild(documentElement);
  19:  
  20:         foreach (XmlElement element in sourceDoc.DocumentElement.ChildNodes)
  21:         {
  22:             this.Rebuild(element, documentElement, 
  23:                 name => newDoc.CreateElement(name));
  24:         }
  25:  
  26:         //根据新的XmlDocument初始化配置字典
  27:         using (Stream newStream = new MemoryStream())
  28:         {
  29:             using (XmlWriter writer = XmlWriter.Create(newStream))
  30:             {
  31:                 newDoc.WriteTo(writer);
  32:             }
  33:             newStream.Position = 0;
  34:             base.Load(newStream);
  35:         }
  36:     }
  37:  
  38:     private void AddIndexes(XmlElement element)
  39:     {
  40:         if (element.ChildNodes.OfType<XmlElement>().Count() > 1)
  41:         {
  42:             if (element.ChildNodes.OfType<XmlElement>().GroupBy(it => it.Name).Count() == 1)
  43:             {
  44:                 int index = 0;
  45:                 foreach (XmlElement subElement in element.ChildNodes)
  46:                 {
  47:                     subElement.SetAttribute("append_index", (index++).ToString());
  48:                     AddIndexes(subElement);
  49:                 }
  50:             }
  51:         }
  52:     }
  53:  
  54:     private void Rebuild(XmlElement source, XmlElement destParent, Func<string, XmlElement> creator)
  55:     {
  56:         string index = source.GetAttribute("append_index");
  57:         string elementName = string.IsNullOrEmpty(index) ? source.Name : $"{source.Name}_index_{index}";
  58:         XmlElement element = creator(elementName);
  59:         destParent.AppendChild(element);
  60:         foreach (XmlAttribute attribute in source.Attributes)
  61:         {
  62:             if (attribute.Name != "append_index")
  63:             {
  64:                 element.SetAttribute(attribute.Name, attribute.Value);
  65:             }
  66:         }
  67:  
  68:         foreach (XmlElement subElement in source.ChildNodes)
  69:         {
  70:             Rebuild(subElement, element, creator);
  71:         }
  72:     }
  73: }
作者:蒋金楠 

为什么针对XML的支持不够好?如何改进?的更多相关文章

  1. .NET Core采用的全新配置系统[9]: 为什么针对XML的支持不够好?如何改进?

    物理文件是我们最常用到的原始配置的载体,最佳的配置文件格式主要由三种,它们分别是JSON.XML和INI,对应的配置源类型分别是JsonConfigurationSource.XmlConfigura ...

  2. Ajax实现异步操作实例_针对XML格式的请求数据

    js分类中有一节[原生js异步请求,XML解析]主要说明了js前台是如何处理XML格式请求和如何接受由服务器返回的XML数据的解析,今天我将用一个实例来说明具体要如何操作. 前台的参数类型也是XML使 ...

  3. java JAXB + STAX(是一种针对XML的流式拉分析API)读取xml

    JDK1.5需要添加jar包,1.6以后就不需要了<dependency> <groupId>stax</groupId> <artifactId>st ...

  4. XML 浏览器支持

    几乎所有的主流浏览器均支持 XML 和 XSLT. Mozilla Firefox 从 1.0.2 版本开始,Firefox 就已开始支持 XML 和 XSLT(包括 CSS). Mozilla Mo ...

  5. “四则运算生成程序——GUI支持和部分功能改进”链接

    项目成员:张金生     张政 <正文随笔发布在张金生博客中> 四则运算生成程序——GUI支持和部分功能改进

  6. [转载]tomcat的配置文件server.xml不支持中文注释的解决办法

    原文链接:http://tjmljw.iteye.com/blog/1500370 启动tomcat失败,控制台一闪而过,打开catalina的log发现错误指向了conf/server.xml,报错 ...

  7. 让.NET xml序列化支持Nullable

    .NET的序列化,关于契约类的生成我们都是通过xsd.exe,对于值类型的可空判断是通过声明同名+Specified的bool属性来判断,比如: public class Person { publi ...

  8. 封装游戏配表读取和存储(xml格式);支持行列存取,标题存取

    做服务器肯定会涉及到游戏配表,而读取游戏配表是一个必备技能; 之前一直都是采用TinyXml直接读,匹配字符串,每次加个表都是一大坨代码,看着也是心累; 因此利用了闲暇的时间封装了一个 xml配置表 ...

  9. 为什么都反对XML而支持使用json呢?

    一个使用上的因素:JSON的结构更容易映射至一般语言的数据结构. XML和JSON的主要组成成分: XML是element.attribute和element content. JSON是object ...

随机推荐

  1. EF 5.0 帮助类 增删改查

    原文地址:http://www.cnblogs.com/luomingui/p/3362813.html EF 5.0 帮助类 加入命名空间: using System; using System.D ...

  2. STL_set&multiset

    1,set的含义是集合,它是一个有序的容器,里面的元素都是排序好的,支持插入,删除,查找等操作,就 像一个集合一样.所有的操作的都是严格在logn时间之内完成,效率非常高. set和multiset的 ...

  3. bfs 记录和打印最短路径

    Poj3984 迷宫问题 #include <iostream> #include <algorithm> #include <cstdio> #include & ...

  4. 【KMP】Number Sequence

    KMP算法 KMP的基处题目,数字数组的KMP算法应用. 主要是next[]数组的构造,next[]存储的是字符的当前字串,与子串前字符匹配的字符数. 移动位数 = 已匹配的字符数 - 对应的部分匹配 ...

  5. thinkphp+datatables+ajax 大量数据服务器端查询

    今天一白天全耗在这个问题上了,知乎2小时除外... 现在19:28分,记下来以备后查. 问题描述:从后台数据库查询人员信息,1w多条,使用一个好看的基于bootstrap的模板 Bootstrap-A ...

  6. JS-Math内置对象

    <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...

  7. Css定位-定位

    在CSS中一共有N种定位方式,其中,static ,relative,absolute三种方式是最基本最常用的三种定位方式.他们的基 本介绍如下. static默认定位方式 relative相对定位, ...

  8. 使用spring @Scheduled注解运行定时任务、

    曾经框架使用quartz框架运行定时调度问题. 老大说这配置太麻烦.每一个调度都须要多加在spring的配置中. 能不能降低配置的量从而提高开发效率. 近期看了看spring的 scheduled的使 ...

  9. Myeclipse 中添加mysql的jdbc驱动

    打开myeclipse后单击菜单栏中的myeclipse——>preferences 然后在Myeclipse Enterprise workbench下的Java Enterprise Pro ...

  10. Linux字符设备驱动

    一.字符设备基础 字符设备 二.字符设备驱动与用户空间访问该设备的程序三者之间的关系 三.字符设备模型 1.Linux内核中,使用 struct cdev 来描述一个字符设备 动态申请(构造)cdev ...