从WEB SERVICE 上返回大数据量的DATASET

前段时间在做一个项目的时候,遇到了要通过WEB SERVICE从服务器上返回数据量比较大的DATASET,当然，除了显示在页面上以外，有可能还要用这些数据在客户端进行其它操作。查遍了网站的文章,问了一些朋友,也找了一些解决方法.
众所周知,如果不用其它方法,直接从WEB SERVICE上传回一个10W条记录的DATASET,可想而知的后果是什么,CPU要占用100%,且要等上几分钟,这是任何一个项目都无法忍受的.在我上网找资料的过程中,试验了几种不同的方法,如通过压缩SOAP改善XML Web service性能,这篇文章所介绍的方法用了SOAP扩展,是通过在WEB SERVICE端用已经过时了的NZIPLIB库来压缩SOAP响应,据称文本压缩率可达80%.文章里面的代码是VB.NET的,费了好大劲翻译成C#的,照上面建项目,但是很可惜,我没有编译成功,总是出错.
这里我找我建好的项目提供大家下载,大家有时间看看是什么问题. SOAP 压缩代码下载
而后,找到了用序列化的方式来减少网络传输量,Microsoft .NET Framework 1.x 中内建两种将物件序列化的 Formatter类别，SoapFormatter 和 BinaryFormatter,两种方式均能减轻网络传输量提高性能,但SoapFormatter方式传输的方式其实还是XML形式，加了很多XML标识，因此压缩率不是很理想，BinaryFormatter用纯二进制的方式序列化DATASET，能使压缩率大大提高，这是台湾作者李匡正 (台灣微軟應用架構技術經理提供的例子里对SQL范例库Northwind的测试结果：

	SoapFormatter	BinaryFormatter
Dataset 序列化後 Bytes 數	1,953,078	1,448,399

很显示然BinaryFormatter　明显优于SoapFormatter　，而我也确实用了BinaryFormatter　这种方式实现了提高效率.
再者，用微软提供的DataSetSurrogate 类可以此基础上进一步压缩数据大小，DataSetSurrogate 在.net 2.0里自带。这是比较结果.

	SoapFormatter	BinaryFormatter
Dataset 序列化後Bytes數	1,953,078	1,448,399
DataSetSurrogate 序列化後Bytes數	2,371,942	575,684

在这里，有两种方式：可把序列化后的数据用文件形式保存在客户端硬盘；也可用Byte[]方式传回客户端，以下是代码。
web service 端(文件形式)

[WebMethod(Description="循环获取远程DATASET")]

  public void SurrogateReadTable(string TableName)

  {

   //把DataSet通过Surrogate Class 序列化成 Binary Stream

   DataSet ds;

   ds=SqlHelper.ExecuteDataset(cnn,CommandType.Text,"select * from "+TableName);

   //实例化DataSetSurrogate,传取出的DATASET到构造函数里

   sds = new DataSetSurrogate(ds);

   //实例化二进制流

   BinaryFormatter bf=new BinaryFormatter();

   StreamWriter swDat;

   //写到本地一个文件里

   swDat = new StreamWriter(@"c:\output_surrogate_dataset.dat");

   bf.Serialize(swDat.BaseStream, sds);

   //这里可以知道序列化后的文件的大小

   long size = swDat.BaseStream.Length;

   swDat.Close();

  }

客户端

private void button1_Click(object sender, System.EventArgs e)

  {

   label1.Text=DateTime.Now.ToString();

   button1.Enabled=false;

   //反序列化Binary Stream能通过Surrogate Class转换成 DataSet

   //从WEB SERVICE上读取方法

   svs.SurrogateRead("t_busdocbase");

   BinaryFormatter bf=new BinaryFormatter();

   StreamReader swDat;

   swDat = new StreamReader(@"c:\output_surrogate_dataset.dat");

   object o=bf.Deserialize(swDat.BaseStream);

  DataSet ds;

   sds = (DataSetSurrogate) o;

   ds = sds.ConvertToDataSet();

   dataGrid1.DataSource=ds.Tables[];

   swDat.Close();

   }

web service 端(Byte[]方式)

[WebMethod(Description="获取业务资料远程DATASET")]

      public byte[] SurrogateRead1()

      {

       DataSet ds;

       ds=SqlHelper.ExecuteDataset(cnn,CommandType.Text,"select * from t_busdocbase");

       sds = new DataSetSurrogate(ds);

       MemoryStream s= new MemoryStream();

       BinaryFormatter bf = new BinaryFormatter();

       bf.Serialize(s,sds);

       byte[] e = s.ToArray();

       return e; 

      }

客户端

private void button3_Click(object sender, System.EventArgs e)

   {

    label1.Text=DateTime.Now.ToString();

    button3.Enabled=false;

    //*反序列化Binary Stream能通过Surrogate Class转换成 DataSet*/

    //从WEB SERVICE上读取方法

     byte [] bb=svs.SurrogateRead1();

     MemoryStream br=new MemoryStream(bb);

     BinaryFormatter bf=new BinaryFormatter();

     object o=bf.Deserialize(br);

     sds = (DataSetSurrogate) o;

     ds = sds.ConvertToDataSet();

     dataGrid1.DataSource=ds.Tables[];

     br.Close();

    }

我个人觉得用byte[]方式会安全些，毕竟不用在客户端产生文件，不用担心数据的安全。

当然作为从网络上读取数据来说，10W条是一个不小量，所有的方式包括压缩，序列化等都是权宜之计，而不是长久之计，在使用当中，我用以上的方法虽然能使网络传输量降低，且可在很短时间内就把数据显示在DATAGRID上，但CPU的开销却达到了100%，这是我一直头疼的。我后来又用了分页的方式，把10W条数据在服务器端就分批取出，每次500条，这样读取时间延长了，但CPU开销却未减轻很多，再后来，又用多线程的方式处理，不甚理想。因此最好的方法就是尽可能的不查询10W条数据，通过条件判断等方式减少所需处理的数据量。

本文从以下文章里借鉴:
http://www.dotnetjunkies.com/PrintContent.aspx?type=tutorial&id=46630AE2-1C79-4D5F-827E-6C2857FF1D23

http://blog.joycode.com/5drush/archive/2004/05/28/22990.aspx

http://www.chinacs.net/archives/11/2004/08/10/2155.html

http://www.microsoft.com/taiwan/msdn/columns/adonet/AdoNet_20041231.htm

http://www.microsoft.com/china/msdn/library/langtool/vcsharp/miszipcompression.mspx

转：http://www.cnblogs.com/flyskywlh/archive/2005/08/18/217382.html

从WEB SERVICE 上返回大数据量的DATASET的更多相关文章

大数据量时Mysql的优化
(转自网络) 如今随着互联网的发展,数据的量级也是撑指数的增长,从GB到TB到PB.对数据的各种操作也是愈加的困难,传统的关系性数据库已经无法满足快速查询与插入数据的需求.这个时候NoSQL的出现暂时 ...
大数据量查询优化——数据库设计、SQL语句、JAVA编码
数据库设计方面: 1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将 ...
sql大数据量查询的优化技巧
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
提高MYSQL大数据量查询的速度
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
Mysql千万级大数据量查询优化
来源于:https://blog.csdn.net/A350204530/article/details/79040277 1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 ord ...
DB开发之大数据量高并发的数据库优化
一.数据库结构的设计如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难度,而且将会影响系统实际运行的性能.所以,在一个系统开始实施之前,完备的数据库模型的设计是必须的. ...
大数据量高并发的数据库优化详解(MSSQL)
转载自:http://www.jb51.net/article/71041.htm 如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难度,而且将会影响系统实际运行的性能. ...
大数据量高并发访问SQL优化方法
保证在实现功能的基础上,尽量减少对数据库的访问次数:通过搜索参数,尽量减少对表的访问行数,最小化结果集,从而减轻网络负担:能够分开的操作尽量分开处理,提高每次的响应速度:在数据窗口使用SQL时,尽量把 ...
利用MySQL数据库如何解决大数据量存储问题？
提问:如何设计或优化千万级别的大表?此外无其他信息,个人觉得这个话题有点范,就只好简单说下该如何做,对于一个存储设计,必须考虑业务特点,收集的信息如下:1.数据的容量:1-3年内会大概多少条数据,每条 ...

随机推荐

JavaI/O系统
I/O:(输入/输出)指的是计算机与外部世界,或者一个与计算机其余部分的接口.它对任何计算机系统都非常关键. Java类库中有大量的类,帮助我们从不同的设备读取数据并保存或输出到不同的设备中. 这些类 ...
5、清理mac缓存和关闭后台运行程序
一.清理mac 缓存 1.用鼠标点击桌面,然后按快捷键Command+Shift+G前往文件夹 2.输入路径:~/Library/Caches/ 3.清除所有的数据,把所有的Caches文件夹得都行 ...
poj 1080 （LCS变形）
Human Gene Functions 题意: LCS: 设dp[i][j]为前i,j的最长公共序列长度: dp[i][j] = dp[i-1][j-1]+1;(a[i] == b[j]) dp[i ...
Monte Carlo 数值积分
var amount = 0.0d; var hitTheTargetCount = 0.0d; var M = 2.0d; var rnd=new Random(); ; i < ; i++) ...
jQuery学习总结（二）
简单选择器: 在使用jQuery 选择器时,我们首先必须使用“$()”函数来包装我们的CSS 规则. 而CSS 规则作为参数传递到jQuery 对象内部后,再返回包含页面中对应元素的jQuery 对象 ...
React Native填坑之旅--Button篇
从React过来,发现React Native(以下简称RN)居然没有Button.隔壁的iOS是有UIButton的,隔壁的隔壁的Android里也是有的.没有Button,就没有点击效果啊.这还真 ...
横竖屏切换时Activity的生命周期
设置横竖屏切换时Activity生命周期的属性设置,在清单文件中的Activity节点中设置.根据具体需求设置: 1.不设置Activity的android:configChanges时,切屏会重新调 ...
spring-data-elasticsearch整合elasticsearch
花了一个晚上整合最新版本的spring-data-elasticsearch与elasticsearch,遇到各种版本冲突之类的问题,测试效果如图: facet搜索:
du -sg 和df -g 所看的文件系统大小不一致
最近碰到一个问题: df -g 查看内存,发现空间已经满了,但是到对应目录查看,发现只用了一半的空间,感觉还有一半不见了. 经咨询其他人,给了两个解释: 1.fsck :使用Fsck命令修复损坏的分区 ...
Google 镜像站搜集[转]
Google 镜像站搜集原文链接:http://www.itechzero.com/google-mirror-sites-collect.html 如果您是以下镜像的作者,并且不希望您的镜像出现在 ...

从WEB SERVICE 上返回大数据量的DATASET

从WEB SERVICE 上返回大数据量的DATASET的更多相关文章

随机推荐

热门专题