ods listing close;ods output summary=class;proc means data=CC.Model_Params stackods n mean std min max maxdec=2;var &VarList.;run;ods output close;ods listing; PROC PRINT DATA=class;RUN;…
PROC MEANS和PRC FREQ在做描述性分析的时候很常用,用法也比较简单,不过这两个过程步的某些选项容易忘记,本文就梳理一下. 在进入正文前,我们先创建所需的数据集TEST_SCORES: DATA TEST_SCORES; INPUT COUNTY : $9. SCHOOL & $21. TEACHER : $8. MATH SCIENCE ENGLISH; DATALINES; HUNTERDON FLEMING MIDDLE SCHOOL SMITH 92 95 88 HUNTER…
常用选项1.使用选项OBS=修改观测序号标签2.使用NOOBS选项不显示观测序号列3.使用ID语句在输出中取代观测序号列4.使用VAR选择输出的变量5.使用WHERE语句选择输出的观测6.使用数据集选项FIRSTOBS=和使用OBS=来控制观测输出的区间 制作增强型报表:1.使用SUM语句对变量进行求和2.使用SUM语句对变量进行分组汇总 改进报表显示:1.添加标题(TITLE)和脚注(FOOTNOTE)2.使用FORMAT语句规定输出格式3.使用LABEL语句规则输出变量的标签(需要在PROC…
输出 print print("Hello World!") # python2 和 python3 的区别 # python2 # coding:utf-8 print 123 #输出数字 print "string" #输出字符串 print "你好" #输出中文 #python3 print(123) #输出数字 print("string") #输出字符串 print("你好") #输出中文 变量…
sas信用评分之第二步变量筛选 今天介绍变量初步选择.这部分的内容我就只介绍information –value,我这次做的模型用的逻辑回归,后面会更新以基尼系数或者信息熵基础的筛选变量,期待我把. Iv值的介绍你们已经很熟悉了,我这次就简单粗暴的说下变量iv值到那个数就可以用的啦. (1):在很多书上说要达到0.1-0.3才是中等相关,达到0.3是强相关,但是这里必须提及,变量的iv值本来就是变量多个分段的iv值的相加.所以我们做这部分工作的时候就发现,一个变量我要是变态一点,分成1000分,…
背景:有很多小的转换需要串联起来,如果前一个执行成功,后面继续接着执行,如果执行等待中,就让程序等一会再次获取数据分析,如果失败就中止,成功就进行下一个转换,以此类推.... 需求:通过job把参数传入的转换,然后转换分析完后输出结果,然后Job接收后再次分析,查看是否需要进行再次循环, kettle文件下载:201911111826-kettle转换设置变量,校验输出新变量 截图说明: 设置变量 检查结果(此处省略在转换中获取job设置的变量) 设置输出一个新变量 通过新的转换,可能做些逻辑,…
查看本章节 查看作业目录 需求说明: 统计"锦途网"旅游线路平均价格,并采用尽可能多的方式将该价格赋给用户会话变量 @avg_short_price,并输出该变量 在 MySQL 客户端重置命令行结束符为"$$",并依次定义一个变量 @avg_short_price 为 decimal(8,2),然后将旅游线路平均价格赋给变量 @avg_short_price,并输出该变量,最后将命令行结束符恢复为";" 实现思路: 需求说明(1)的解决思路 获…
方法一:使用aggregate()分组获取描述性统计量 aggregate(mtcars[vars],by=list(am=mtcars$am),mean) aggregate(mtcars[vars],by=list(mtcars$am),mean) aggregate(mtcars[vars],by=list(am=mtcars$am),sd)…
数据的分布特征: 分布的集中趋势,反应各数据向其中心值靠拢或聚集的程度(平均数,中位数,四分位数,众数) 分布的离散程度,反应各数据远离其中心值的趋势(极差,四分位差,方差,标准差,离散系数) 分布的形状,反应数据分布的偏斜程度和峰度(偏态系数,峰度系数) ####################### 平均数(均值):一组数据相加后除以数据的个数而得到结果,称为平均数(mean) 中位数:一组数据排序后处于中间位置上的变量值,称为中位数(median) 四分位数:一组数据排序后处于25%(下四…
以下代码实现功能: 1.获取10个模型分别使用哪些变量 2.变量所模型使用的次数 3.把上表格输出到EXCEL中 %INCLUDE '00@HEADER.SAS'; %let dir=..\04@Model; libname cc "&dir"; PROC FORMAT; VALUE UseFmt 1='使用' 0='未使用' OTHER='其它' ;RUN; PROC DATASETS LIBRARY=S NODETAILS NOLIST; DELETE ModelVaria…