SAS学习笔记13 SAS数据清洗和加工（续）

【SAS学习笔记13 SAS数据清洗和加工（续）】的更多相关文章

SAS学习笔记13 SAS数据清洗和加工（续）

查找缺失值 cha[*]和num[*]是建立数组cha和num,但不指定数组中的元素数自动变量_character_表示数据集中的所有字符型变量自动变量_numeric_表示数据集中的所有数值型变量 _all_表示数据集中的所有变量 if和where的区别 where运行的速度要快一些,因为它是在数据读入之前就执行选择条件,而if是在数据读入之后才执行.但只有在数据量很大的时候才能感觉出来,正常几百几千个数据几乎感觉不到只能用if的场合使用自动变量时,只能用if,不能用where 如果指…

SAS学习笔记51 SAS数据集

结构 SAS数据集是关系型的,包含两个部分:描述部分(变量)和数据部分(观察值) 形式 SAS系统中共有两种类型的数据集: 1.SAS 数据文件(SAS datafiles) 2.SAS 数据视窗(SAS dataviews)—— 只有描述部分,没有数据部分数据集的名字 SAS数据集名字包括三个部分,即: Libref.data-set-name.membertype 1.Libref(库标记)──这是SAS数据库的逻辑名字 2.data-set-name(数据集名字)──这是SAS数据集的名…

SAS学习笔记12 SAS数据清洗和加工

set语句纵向合并我们把a1和b1进行合并,并区分是来自哪个数据集,会用到in=选项 in=a是产生临时变量a,由于它是a1的选项,所以a的值=1(来自a1)或者=0(不来自a1) in=b是产生临时变量b,由于它是b1的选项,所以b的值=1(来自b1)或者=0(不来自b1) 需要注意的是,临时变量可以调用,但不会在结果里显示,这也是为什么要加上a1=a;和b1=b;这两句数据对比 by语句指定索引变量(通常为id号).通过by语句可以避免错位比较的情况 id语句指定索引变量,可以让你根据变…

SAS学习笔记50 SAS数据集索引

在没有索引的情况下,SAS是一条接一条的扫描观测:有索引时,直接跳到该索引对应的观测所在位置.总结一句话就是:节省时间,节省内存,提高效率当然并不是任何情况下使用索引都能提高工作效率,因为建立索引本身需要耗费内存,是否使用索引,要视具体情况而定.SAS中的语言优化器会自动判断是否需要使用索引在实际使用中,出于效率考虑,我们只会为经常在WHERE条件中使用的变量,和用来合并SAS数据集的变量建立索引建立索引的情况: 访问的观测远远小于总体用于BY语句引用已排序的变量索引分为简单索引[si…

SAS学习笔记40 SAS程序运行过程

当我们提交运行一个DATA步程序后,具体发生了什么事情. SAS程序与其他程序一样,在运行时都要经过两个阶段:编译(Compilation).执行(Execution) 程序首先经过编译阶段,该阶段主要检查代码语法错误,以及执行一些编译时语句及创建PDV,缓存等相关的环境.如果发现代码存在语法错误,则不进入执行阶段,并且将发现的所有语法错误问题在日志中显示: 如果在编译阶段未发现语法错误,则程序会进入执行阶段,真正运行代码,读取数据,处理数据. SAS程序中的语句,按照其在编译阶段还是执行阶段生…

SAS学习笔记38 SAS Comments注释语句

通常来讲,注释语句有四种: 1.* message; 2.COMMENT message; 3./* message */ 4.%* message; 第一种的主要限制是注释之中不得有“:”符号.通常用于非宏程序之中. 第二种和第一种相同. 第三种的主要限制是不得包含另外的注释语句. 第四种用于在宏程序里做注释,其功能和第一种在非宏的文本里很相似.第三种注释对宏和非宏程序并无区分.如果把第一种方式移植到宏程序里,出错误的机率非常大.举一例: 方式1和2属于完整的SAS声明语句.他们在程序编译时总…