SAS之大话PDV

之所以说是数据源,而非输入缓冲区的原因上一条推送已经说明,这里就不再啰嗦啦。

这里我们且将DATA步流程简单地分为从数据源读入到pdv和从pdv写入数据集。

IF语句 & WHERE语句

这两个语句均是用于条件选择,但二者作用时机却大有不同。简单来说,if语句作用于观测出PDV到生成数据集时;而where语句则作用于观测进入PDV之时。这也奠定了二者效率上的差别。由于where语句作用于观测进入PDV之时,SAS读入的观测已经过选择,读入观测数较少,所以在读入较大数据之时,where语句的优势就尤为明显了。

但又是因为where语句作用于观测进入PDV之时,也带来了一些限制,如:

当提交如上语句之时,SAS将会报错:

ERROR: 变量 x 不在文件“WORK.B”中。

而使用if语句则不会出现此ERROR。

对于这些选项的作用,相信大家也都有所了解;如不了解,那就得好好补补基础咯

言归正传,对于这些语句的作用时机,就不再一一演示,简单来说,rename、keep、drop语句用于PDV到生成数据集的过程中。而对于选项,则需看选项的位置:

对于上述代码,大家可自行敲击运行,就会发现在数据集b生成过程中出现NOTE:
变量 age 未初始化。
 原因就在于当选项用于set语句时,作用时机为原始数据至PDV之间;而当选项用于data语句时,则作用于PDV至生成数据集之间。

SASDATA步中使用SET语句、MERGE语句和UPDATE语句读入变量时(除赋值语句和input语句外),SAS将会自动retain,即由这些语句读入的变量将不会被置缺失。

不多说,上例子:

例1:merge

结果:

运行过程:

从a读入第1条观测,从b读入第1条观测,查看id(即by变量)是否匹配,若不匹配,则读入id较小的观测,若匹配则一起读入PDV。此例为匹配。

到达RUN语句,将PDV写入数据集

从a、b分别读入第2条观测,检查发现不匹配。检查id是否与PDV中相同,若是,则读入匹配的观测(即a中第二条观测),若都不同,则将较小的id观测读入。

达到run语句,OUTPUT;

读入a的第3条观测,b的第2条观测,检查发现不匹配。再检查id发现a中第3条与PDV中id匹配,将其写入。后output。

读入a的第4条观测,b的第2条观测,检查发现匹配,再检查发现与PDV中id不同;此时进入另一个by组,初始化DVP。将匹配的观测写入DVP。

读入a中第5条观测,b中第3条观测,发现id不匹配,再检查发现b中第3条观测id与PDV中id匹配,将其读入,后output。

读入a中第5条观测,b中第4条观测,发现id匹配并与PDV中id不同,初始化pdv,将两条观测整合写入PDV,后output。

由于a中观测已读完(EOF),读入b中第5条观测,发现与PDV中id不同,初始化PDV,读入b中第5条观测,output。注意此时由于没有匹配,且为新的by组,不存在retain的x变量,所以最后一条观测中x为空。

a、b数据集均到达EOF,程序运行结束,保存数据集。

例2:set

结果:

这时候大家可能会发现,第二条观测不是同一个by组吗?为什么第2条观测的x变量不是第一条中x的值呢?为什么没有retain?

然而,其实还是有retain的,只不过数据集中体现不出来,而结果为什么会是那样呢?这就涉及到PDV的又一个原则,当PDV从一个新的数据集中读入观测时,会将PDV置缺失。

若你想看出retain的效果呢,有个办法:

对于UPDATA等其他语句,就不再举例啦,有兴趣者可自行探索。

SAS之大话PDV的更多相关文章

  1. SAS笔记(1) PDV与数据读入

    其实我是不喜欢SAS的.当然,我不喜欢她,并不代表她不好,实际上在某些应用场景下SAS是款很优秀的软件.我的数据分析之路始于R,品尝过R的灵活与简洁(不论是软件安装还是语法)后,再来学习SAS,的确提 ...

  2. SAS 对数据的拼接与串接

    SAS 对数据的拼接与串接 使用SAS对数据进行串接.合并.更新与修改. 1. 数据集的纵向串接 数据集的纵向串接指的是,将两个或者多个数据集首尾相连,形成 一个新的数据集. 对数据集的纵向串接可以通 ...

  3. SAS 创建新变量

    SAS  创建新变量 在对SAS数据集进行处理时,经常需要根据原有变量或变量值生成新变量.根据要实现功能的不同,SAS提供了多种方法,例如通过数据集选项RENAME=(RENAME语句).赋值语句.求 ...

  4. SAS对数据变量的处理

    SAS对数据变量的处理 在使用DATA步基于已经存在的数据集生成新数据集时,可以指定在新数据集中不需要包含的变量而仅读取其他变量,或者指定仅需要在 新数据集中包含的变量.该功能可以通过DATA步中的S ...

  5. SAS DATA步读取数据

    上面一节讲了SAS的基本概念,以及语法结构,这次主要讲解SAS DATA步读取数据.    1 ·列表输入    2 ·按列输入    3 ·格式化输入  使用DATA步读取数据的基本形式如下: DA ...

  6. SAS笔记(2) RETAIN语句

    本文重点: 使用RETIAN,INPUT在每次循环执行时保留上一次PDV中的变量值. SUM语句和SET语句会自动RETAIN变量. 1. RETAIN语句 1.1 Example 1 先来看看在DA ...

  7. SAS编程基础 - 数据获取与数据集操作(1)

    1. 数据来源 SAS数据来源主要有两种:一是通过input语句创建,另外一种方式是通过外部数据文件获取. 1.1 libname 1.2 odbc 1.3 passthrough 1.4 impor ...

  8. SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...

  9. SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...

随机推荐

  1. springBoot 项目 jar/war打包 并运行

    一:idea  打jar  包 简述:springboor  项目最好的打包方式就是打成jar  ,下边就是简单的过程 1.打开idea工具 ,选着要打开的项目, 然后打开view--> too ...

  2. 使用传统javaweb进行文件上传

    使用传统文件上传方式 1.配置依赖 <properties> <project.build.sourceEncoding>UTF-8</project.build.sou ...

  3. [51nod-1364]最大字典序排列

    [51nod-1364]最大字典序排列 Online Judge:51nod-1364 Label:线段树,树状数组,二分 题目描述 题解: 根据题意很容易想到60%数据的\(O(N^2logN)\) ...

  4. 安装postgresql11.5

    root身份安装 创建用户 编译安装成功后,接下来要做的就是创建一个普通用户,因为默认超级用户(root)不能启动postgresql,所以需要创建一个普通用户来启动数据库,执行以下命令创建用户: [ ...

  5. Odoo加载机制指导流程

    Odoo的启动通过openerp-server脚本完成,它是系统的入口. 然后加载配置文件openerp-server.conf 或者 openerp_serverrc: openerp-server ...

  6. error LNK2005:"private:__thiscall编译错误

    对于这种编译错误,网上给出了很多解决办法,大部分都是忽略特定库,或者改变多线程调试DLL,但是均没有效果. 这里记录下自己的解决方法,首先按照下图,取消从父级或项目默认设置继承,避免与其他库中的定义冲 ...

  7. str_replace函数的使用规则和案例详解

    str_replace函数的使用规则和案例详解 str_replace函数的简单调用: <?php $str = '苹果很好吃.'; //请将变量$str中的苹果替换成香蕉 $strg = st ...

  8. 【HTML5】如何处理HTML5新标签的浏览器兼容版问题

    HTML5规范毕竟是刚刚才定义完成的规范,还有一些浏览器并不能支持其中的新标签和新属性,尤其是IE8及以下版本浏览器.以下介绍一些在页面中使用HTML5新标签的实践方法,目的是让HTML5中的新标签在 ...

  9. EPSG、SRID、WKT的概念

    转自:http://www.cnblogs.com/jackdong/archive/2010/12/20/1911558.html EPSG:European Petroleum Survey Gr ...

  10. java 异常捕获小记

    java 中异常捕获常用的为: try{ //业务代码 }catch(Exception e){ //异常捕获 }finally{ // 不管有无异常, 最后都会执行到这里 } 在方法体内如果想要把异 ...