一、数据集:

首先介绍数据集参数:

英文简称 英文全称 中文全称 单位 换成正常单位 说明1 说明2
Time Time 时间 小时:分钟      
Temp Temperature 温度 摄氏度      
DO Dissolved Oxygen 溶解氧 mg/m3 1mg/m3 = 1x10-3mg/L    
Clar Visual Water Clarity 透明度 m   中文全称是否正确  
Turb Turbidity 浊度 NTU   单位全称nephelometric turbidity unit  
pH Hydrogen ion concentration 氢离子浓度        
Cond Electrical conductivity 电导率 uS/cm 在25℃下      
BOD5 Biochemical Oxygen
Demand-5 day incubation
生化需氧量
培养5天
ppm   在20℃下进行5天氧耗尽实验  
NH4-N Ammonia 氨氮浓度 mg/m3   该数据受到实验室NH4污染  
NO3+NO2 Nitrate+Nitrite nitrogen 硝酸盐+亚硝酸盐 mg/m3   主要存在硝酸盐  
TN Total Nitrogen(Organic N + NO3 + NH4) 总氮(有机氮+硝酸盐+铵) mg/m3      
DRP Dissolved Reactive Phosphate 溶解活性磷酸盐 mg/m3      
TP Total Phosphate 总磷 mg/m3      
A340 Absorbance @ 340nm 在340nm的吸光度 Abs x1000 采用四舍五入成整数    
A440 Absorbance @ 440nm 在440nm的吸光度 Abs x1000 采用四舍五入成整数    
A740 Absorbance @ 740nm 在740nm的吸光度 Abs x1000 采用四舍五入成整数    
g340 Absorbance co-efficient @ 340nm 在340nm的吸光度系数 /m   从340和740nm处的吸光度值计算得到  
g440 Absorbance co-efficient @ 440nm 在440nm的吸光度系数 /m   从440和740nm处的吸光度值计算得到  
T_coil Total coliforms 总大肠菌群 /100ml     数据从2005年开始记录
E_coil Feacal coliforms 粪大肠菌群 /100ml     数据从2005年开始记录

二、数据检测过程说明

1.上述表格中的时间、温度、溶解氧、透明度是在现场测量到的(DO是现场测量%DO,在实验室转换为ppmDO)

2.将水质样品收集在1升聚乙烯瓶中,气密密封,在冰箱中存储,24h内送到化学实验室进行分析。

3.收到样品后,加热至室温(样品瓶放置于水浴中),立即分析pH、电导率、浊度;然后将剩余样品进行二次取样到100ml的容器中获得总氮、吸光度、吸光度系数、铵、硝酸盐、溶解磷酸盐等数据。

4.将初始1升样品瓶中的剩余样品用于BOD测试(在20℃下进行5天的氧耗尽实验)。

三、数据缺失说明

整个数据的跨度从1989年1月~2018年12月,不过其中部分数据缺失:

  1. 1994年的氨和总氮数据丢失。
  2. 1989年1月~2008年12月,因为温度探头寿命耗尽,部分地区缺少温度数据。
  3. 1989年1月~1994年12月,分析实验在非空调环境下运行。从1995年1月,实验室迁移到新空调屋,样本分析过程引入的误差减少。
  4. 1989年1月~2001年12月,DRP、NO3、NH4、TN、TP数据都是采用人为采样的方法手动跟踪,后来才采用电子数据替代。
  5. BOD分析在2002年7月之后停止,仅保留AK2、RO2、WA9站点,因为BOD在大多数场所都较低,没有明显变化趋势。
  6. 从2002年2月开始,进行细菌分析(总大肠菌群和粪便大肠菌群)

四、数据测量地点说明

河流英文名称 河流中文名称 样本采集地英文名称 数据集名称 数据集个数
Clutha 克鲁萨河 Balclutha DN4 29
Luggate Br AX1 29
Millers Flat AX4 29
Manawatu     玛纳瓦图河   Opiki Br WA9 29
Teachers Coll WA8 29
Weber Rd WA7 29
Mataura   马陶拉河  Parawa DN6 29
Seaward Down DN5 29
Mohaka    莫哈卡河 Glenfalls HV6 29 
Raupunga HV5 29
Motueka   莫图伊卡河 Woodstock NN1 29 
Gorge NN2 29
Ngahere   纳黑里河  Chesterhope HV3 29 
Kuripapango HV4 29
Opihi   奥皮希河  Grassy Banks TK1 29
Rockwood TK2 29
Oreti   奥雷蒂河  Lumsden DN77 29
Riverton HW Br DN8 29
Rangitaiki    朗伊泰基河  Murupara RO3 29 
Te Teko RO5 29
Rangitikei   朗伊蒂基河  Kakariki WA6 29 
Mangaweka WA5 29 
Ruamahanga      鲁玛昂加河 SH2 WN5 29 
Waihenga WN3 29
Wardells WN4 29
Taieri   泰里河  Outram DN3 29
Tiroiti DN1 29
Tarawera    塔拉威拉河(黑色排水沟) Awakaponga RO2 29
outlet RO1 29
Waikato    怀卡托河   Hamilton Traffic Br HM3 29
Rangiriri HM4 29
Reids Farm RO6 29
Waipa    怀帕河  Otewa HM1 29
Whatawhata HM2 29
Wairau    怀劳河   Dip Flat NH3 29
Tuamarina NH4 29
Purua WH4 29
Waitaki   怀塔基河  kurow TK4 29
SH1 Br TK6 29
Whanganui   旺加努伊河  Paetawa WA4 29
Te Maire TU1 29

AN之数据集的更多相关文章

  1. SSD框架训练自己的数据集

    SSD demo中详细介绍了如何在VOC数据集上使用SSD进行物体检测的训练和验证.本文介绍如何使用SSD实现对自己数据集的训练和验证过程,内容包括: 1 数据集的标注2 数据集的转换3 使用SSD如 ...

  2. HTML5 数据集属性dataset

    有时候在HTML元素上绑定一些额外信息,特别是JS选取操作这些元素时特别有帮助.通常我们会使用getAttribute()和setAttribute()来读和写非标题属性的值.但为此付出的代价是文档将 ...

  3. 数据集偏斜 - class skew problem - 以SVM松弛变量为例

    原文 接下来要说的东西其实不是松弛变量本身,但由于是为了使用松弛变量才引入的,因此放在这里也算合适,那就是惩罚因子C.回头看一眼引入了松弛变量以后的优化问题: 注意其中C的位置,也可以回想一下C所起的 ...

  4. Lind.DDD.ExpressionExtensions动态构建表达式树,实现对数据集的权限控制

    回到目录 Lind.DDD框架里提出了对数据集的控制,某些权限的用户为某些表添加某些数据集的权限,具体实现是在一张表中存储用户ID,表名,检索字段,检索值和检索操作符,然后用户登陆后,通过自己权限来构 ...

  5. Lind.DDD.Caching分布式数据集缓存介绍

    回到目录 戏说当年 大叔原创的分布式数据集缓存在之前的企业级框架里介绍过,大家可以关注<我心中的核心组件(可插拔的AOP)~第二回 缓存拦截器>,而今天主要对Lind.DDD.Cachin ...

  6. 数据集转换为Json

    数据集转换为Json 第一步:新建一个类对象  通常我会写三个属性:状态.返回信息.数据集 第二步:新建一个JSON转换类 第三步:把类对象当做参数传入JSON转换类 ———————————————— ...

  7. IRIS数据集的分析-数据挖掘和python入门-零门槛

    所有内容都在python源码和注释里,可运行! ########################### #说明: # 撰写本文的原因是,笔者在研究博文“http://python.jobbole.co ...

  8. fetch_20newsgroups 数据集导入失败: no handlers could be fetch_20newsgroups

    最简单的办法 下载'20news-bydate.pkz', 放到C:\\Users\[Current user]\scikit_learn_data 下边就行. 实际上 scikit learning ...

  9. Fast RCNN 训练自己的数据集(3训练和检测)

    转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ https://github.com/YihangLou/fas ...

  10. Fast RCNN 训练自己数据集 (2修改数据读取接口)

    Fast RCNN训练自己的数据集 (2修改读写接口) 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ http ...

随机推荐

  1. 看过这些我明白了依赖注入及IoC

    背景 最近一段时间在学习laravel框架,了解到这个框架一个比较核心的概念就是服务容器,而服务容器似乎又和依赖注入有关系.但是碍于官方关于这方面的讲解篇幅过少,所以自学了一下. 自学的途径也跟大家一 ...

  2. 微信小程序の小程序事件流

    一.什么是事件? 事件是视图层到逻辑层的通讯方式:事件可以将用户的行为,反馈到逻辑层进行处理:事件可以绑定在组件上,触发事件后,就会执行逻辑层中对应的事件处理函数:事件对象可以携带额外信息. 二.事件 ...

  3. 概率——17icpc西安

    不知道为什么是这样子的.. #include<bits/stdc++.h> using namespace std; int m,n; int main(){ while(scanf(&q ...

  4. cf期望概率专题

    cf1009E:求到第i段期望和的比较困难,但是单独求每段的期望是比较容易的,所以单独对每段求和,然后累计总和 E[i]=1/2*a1+1/4*a2+...+1/2^(i-1)*ai-1+1/2^(i ...

  5. BZOJ 4698: Sdoi2008 Sandy的卡片(后缀数组+差分+二分答案)

    传送门 解题思路 看到一个子串加一个数字到另一个子串,自然可以想到差分.然后要把所有串都拼起来,求出\(height\)数组后可以二分答案来做,每次二分一个答案后统计一下连续的\(height> ...

  6. NX二次开发-UFUN打开本地文本文档uc4504

    NX9+VS2012 #include <uf.h> #include <uf_cfi.h> #include <uf_ui.h> using std::strin ...

  7. 让IE8兼容识别css3选择器——selectivizr-min.js

    html: <!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF ...

  8. centos coreseek

    下载稳定版 coreseek wget http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz 解压 .tar.gz cd cor ...

  9. XSS的原理分析与解剖:第四章(编码与绕过)*******************未看**********************

    0×01前言 很抱歉,这第四章被我推了几个月,今天是元旦难得有空,就把第四章写下.我先把主要使用的编码说下,介绍完会说下绕过. 本文建议与<杂谈如何绕过WAF>一同阅读. 0×02 URL ...

  10. C语言新手写扫雷攻略3

    界面绘制好后,雷数也布置了,接下来就是游戏的运行过程了,今天先不说具体过程,再来看看需要用到的辅助函数 先是简单的画红旗,鼠标右键的功能是画红旗,至此我们都是在使用函数自己绘图,效率是低,但有助于理解 ...