SAS笔记(5) FLAG和计数器】的更多相关文章

考虑这样一种场景:我们有一份患者入院检查的数据,我们知道一个患者有可能会多次去医院做检查,每次检查的结果可能为阳性,也可能为阴性.我们现在关注的是某一个患者在若干次检查中是否出现了阳性结果,在R中我们可以使用any函数,在python中可以利用pandas的groupby函数,在SAS中该如何处理呢?今天就立一个flag来解决它. 1. ***创建数据 DATA LAB; INPUT PATNO VISIT_NO OUTCOME; DATALINES; 3 1 0 3 2 0 3 3 1 1 1…
SAS基础知识 SAS里面的PROC一览 The ACECLUS Procedure : 聚类的协方差矩阵近似估计(approximate covariance estimation for clustering) The ANOVA Procedure :方差分析 The BOXPLOT Procedure :箱形图 The CALIS Procedure :结构方程模型 The CANCORR Procedure :典型相关分析 The CANDISC Procedure :主成分分析和典型…
前面写了导出文件接口的测试,对于导出文件的文件名称,为了不重复(即不覆盖之前的文件),可以添加一个计数器来设置不同的index,另外也可以借助函数助手. 下面是我使用到的关于计数器的简单应用,其他的自行拓展,推荐文章:http://blog.sina.com.cn/s/blog_13cc013b50102wn2w.html 1.线程组(或者测试计划)右键添加 -> 配置元件 -> 计数器 2.计数器配置 3.使用计数器的变量名称 4.执行后的结果 5.结合循环次数获取不同的值 注意:当循环次数…
在实际应用中,我们经常会把宽数据(一个患者一条观测)转化为长数据(一个患者多条观测)或者将长数据(一个患者多条观测)转换为宽数据(一个患者一条观测),在R中我们可以利用Reshape2包来实现.在SAS中有两种实现方法:数组和TRANSPOSE.这一篇博文先讲解利用数组重构SAS数据,下一篇博文将介绍利用TRANSPOSE函数重构SAS数据. 1.宽数据变长数据 ***创建数据集 DATA DIAGNOSE; INPUT @1 PATNO 2. @3 DATE MMDDYY10. @14 DX1…
参考资料:<Longitudinal Data and SAS: A Programmer's Guide>…
FIRST.和LAST.临时变量是SAS很有特色的一点,我在R和Python中暂时没有发现类似的功能(也许它们也有这个功能,我不知道而已).考虑这样一种场景:我们有患者就诊的数据,每一条观测对应一个患者的一次就诊记录,我们知道一个患者可能会多次就医,那么如何找到这个患者第一次就医时间以及最有一次就医时间呢?又或者我们如何确定一个患者是不是因为同一个疾病多次入院.这篇博文将详细介绍如何利用FIRST.和LAST.这两个临时变量解决类似问题. 1.创建FIRST.和LAST.临时变量 创建FIRST…
在实际的应用中,我们会想查看当前观测的上一个观测值,在上一篇博客中我们使用了RETAIN语句来记录上一条观测,其实SAS还提供了一个很好用的函数LAG.当我们使用函数时,一定要明确该函数的返回值是什么.之前我一直认为LAG就是滞后一阶,返回当前观测的上一个值,实际上这种理解是错误的. LAG返回的是上一次LAGE函数运行时的实参,即LAG(argument)=上一次LAG函数执行时的argument. 1. LAG函数 1.1 用LAG计算差值 DATA COMPARE; INPUT X; LA…
本文重点: 使用RETIAN,INPUT在每次循环执行时保留上一次PDV中的变量值. SUM语句和SET语句会自动RETAIN变量. 1. RETAIN语句 1.1 Example 1 先来看看在DATA步不使用和使用RETAIN语句的差异 没有使用RETAIN: DATA WITHOUT_1; PUT "Before the INPUT statement: " _ALL_; INPUT X @@; PUT "After the INPUT statement: "…
其实我是不喜欢SAS的.当然,我不喜欢她,并不代表她不好,实际上在某些应用场景下SAS是款很优秀的软件.我的数据分析之路始于R,品尝过R的灵活与简洁(不论是软件安装还是语法)后,再来学习SAS,的确提不起兴致.然而由于:1.导师的项目数据量较大(几Gb到几十Gb):2.之前的项目代码师兄已经用SAS很优美地实现了:3.我莫名地当上了该项目负责人,要带着师弟师妹做该项目.我也只好硬着头皮学习SAS.奈何现在脑力大不如前,看的东西越来越记不住,于是下定决心梳理一下SAS相关知识. 1. DATA步简…
PROC MEANS和PRC FREQ在做描述性分析的时候很常用,用法也比较简单,不过这两个过程步的某些选项容易忘记,本文就梳理一下. 在进入正文前,我们先创建所需的数据集TEST_SCORES: DATA TEST_SCORES; INPUT COUNTY : $9. SCHOOL & $21. TEACHER : $8. MATH SCIENCE ENGLISH; DATALINES; HUNTERDON FLEMING MIDDLE SCHOOL SMITH 92 95 88 HUNTER…