SAS (Statistics Analysis System) 统计分析系统软件
SAS
SAS (Statistical Analysis System) 是一个统计软件系统,由 SAS Institute 开发, 用于数据管理, 高级分析, 多元分析, 商业智能, 刑事调查和预测分析. SAS 由北卡罗来纳州立大学在1966至1976年之间开发, 并于1976年成立了 SAS Institute. 1980年代和1990年代得到进一步发展, 增加了新的统计程序和额外的组件并引入了JMP. 在2004年的版本9 中增加了点击式图形交互界面. 2010年增加了社交媒体分析产品.
技术概述
SAS是一整套软件, 用于挖掘, 更改, 管理和检索各种来源的数据并对其进行统计分析. SAS通过SAS语言为非技术用户提供了一个图形点击式用户界面. SAS程序有检索和操作数据的 DATA 步骤, 和分析数据的 PROC 步骤, 各步骤都由一系列语句组成.
- DATA 步骤包含可执行的语句用于使软件执行操作, 声明性语句用于读取数据集或修改数据呈现.
- PROC 步骤由调用函数(procedure)的PROC语句组成, 函数对数据集进行分析以生成统计, 分析和图形. 有300多个函数, 每个函数都包含大量的编程和统计工作.
- 有宏语句, 一次编写, 之后可以在其他地方重复使用.
在2007年增加输出投递系统(Output Delivery System)后, 数据可以以HTML, PDF, Excel, RTF和其他格式发布. SAS套件有超过200个组件.
起源
SAS的开发开始于1966年, 当时北卡罗来纳州立大学聘请 Anthony Barr 对他的方差分析和回归软件进行编程, 以便它能在IBM System/360计算机上运行. 项目由美国国立卫生研究院(National Institutes of Health)资助. 最初目的是为了分析农业数据以提高作物产量. Barr 和学生 James Goodnight 一起开发了该软件的统计程序, 两人成了项目负责人.
- 1971年, 第一个版本是以发布的年份命名的: SAS 71. 作为有限功能版本, 它只能在IBM大型机中使用, 具有SAS编程的主要元素, 例如 DATA 步骤和 PROC 步骤中最常见的过程
- 1972年发布了SAS 72, 这是一个完整版本, 它引入了MERGE语句并增加了处理缺失数据或合并数据集的功能.
- 1976年 Barr, Goodnight, Sall 和 Helwig 成立了 SAS Institute 该项目由此从北卡罗来纳州立大学迁入新公司.
发展历史
SAS 在版本76中被重新设计, 使用了允许编译器和过程的开放架构. 改进了 INPUT 和 INFILE, 从而可以读取IBM大型机使用的大多数数据格式. 还通过 PUT 和 FILE 添加了生成报告的功能. 还增加了分析一般线性模型的能力以及格式化程序, 允许开发人员定制数据外观. 1979年, 版本79增加了对 CMS 操作系统的支持, 引入了数据集方法. 版本82引入了早期的宏语言和 APPEND 方法.
1985年, SAS用C编程语言重写. 这允许 SAS 在 UNIX, MS-DOS和Windows上运行. 之前是用PL/I, Fortran 和汇编语言编写的.
从80年代至90年代, SAS发布了许多组件来补充基本的SAS功能
- 1980年发布了制作图形的SAS/GRAPH, 以及支持计量经济学和时间序列分析的SAS/ETS组件
- 1990年前后代发布SAS/PH-Clinical, 一个面向医药行业用户的组件. 美国食品药品监督管理局(The Food and Drug Administration)2002年对新药申请的 SAS/PH-Clinical 进行了标准化.
- 垂直领域的SAS Financial Management 和 SAS Human Capital Management (后来称为 CFO Vision and HR Vision respectively).
- JMP是由 John Sall 的团队开发的, 利用了1984年苹果 MacOS 引入的图形用户界面, 并于1989年发售. JMP在2002年后不断更新, 最近一次发布是在2016年.
- 版本6在整个20世纪90年代都在使用, 并可用于更广泛的操作系统, 包括Macintosh, OS/2, Silicon Graphics和PRIMOS. SAS通过点发布引入了新功能
- 版本6.06到6.09, 引入了基于 Windows 的用户界面, 并增加了对SQL的支持.
- 第7版引入了产出交付系统和改进的文本编辑器.
- ODS在后续版本中得到了改进. 在版本8中增加了更多的输出选项. 支持的操作系统数量减少到UNIX, Windows和z/OS, 并增加了Linux
- 第8版和SAS Enterprise Miner于1999年发布.
现状
- 2002年推出了文本挖掘软件. Text Miner分析电子邮件等文本数据, 寻找商业智能应用程序中的模式.
- 2004年, SAS 9.0版发布, 被称为“水星计划”, 旨在使更多的商业用户能够使用SAS. 9.0版增加了基于用户角色的自定义用户界面, 并将SAS企业指南的点击式用户界面作为软件的主要图形用户界面.
- 2004年, SAS互动管理改进了客户关系管理(CRM)功能.
- 2008年, SAS宣布了Unity项目, 旨在整合数据质量, 数据集成和主数据管理.
- 2010年, 推出了免费的教育版本. 发布的 SAS Social Media Analytics是一款社交媒体监控, 互动和情感分析工具, 同年推出了SAS快速预测建模器(RPM), 它使用Microsoft Excel创建基本的分析模型.
- JMP 9在2010年增加了使用JMP R编程语言的新界面和Excel插件. 与Teradata和EMC Greenplum合作推出了一款高性能计算设备.
- 2011年, 公司发布了Enterprise Miner 7.1. 该公司从2013年10月到2014年10月推出了27个数据管理产品, 并更新了160个其他产品.
- 2015年SAS全球论坛, 宣布了几个专门针对不同行业的新产品, 以及新的培训软件.
软件产品
SAS的主要功能分4块: 数据访问, 数据管理, 数据分析, 数据呈现
SAS最大的产品线是其客户智慧(customer intelligence)系列
- 用于网络, 社交媒体和营销分析的众多SAS模块可用于描述客户和潜在客户, 预测他们的行为以及管理和优化沟通.
- SAS还提供了欺诈框架Fraud Framework, 该框架的主要功能是监控不同的应用网络和合作伙伴之间的交易并分析识别存在欺诈的异常情况.
- SAS Enterprise GRC(企业的治理, 风险和合规)提供风险建模, 情景分析和其他功能, 以便管理数据风险, 合规风险并将其可视化
- 还有SAS Enterprise Risk Management产品集, 主要面对的是银行和金融服务机构用户
- SAS IT Management Solutions 用于监控和管理IT系统运行, 从各种IT资产收集关于性能和利用率的数据, 然后创建报告和分析
- SAS' Performance Management 用于整合并提供员工, 部门和组织级别的绩效KPI的图形化显示.
- SAS Supply Chain Intelligence 用于满足供应链需求, 例如预测产品需求, 管理分销和库存以及优化定价
- SAS for Sustainability Management 用于预测环境, 社会和经济影响, 并确定业务与对环境或生态系统的影响之间的关系
SAS 对各行业有不同的产品组合, 如政府, 零售, 电信和航空航天, 以及营销优化或高性能计算.
产品版本
版本 | 日期 | 备注 |
---|---|---|
72 | January 1972 | |
76 | July 1976 | |
79.5 | April 1981 | |
82.4 | January 1983 | |
4.06 | March 1984 | |
5.03 | January 1985 | |
6.01 | July 1986 | PC DOS |
6.03 | March 1988 | |
6.06 | March 1990 | |
6.07 | April 1991 | |
6.08 | March 1993 | |
6.09 | October 1993 | |
6.10 | October 1994 | |
6.11 | October 1995 | |
6.12 | November 1996 | |
7.0 | October 1998 | |
8.0 | November 1999 | |
8.1 | July 2000 | |
8.2 | March 2001 | |
9.0 | October 2002 | |
9.1 | December 2003 | |
9.1.3 | August 2004 | |
9.2 | March 2008 | STAT 9.2 |
9.2M2 | April 2010 | STAT 9.22 |
9.3 | July 2011 | STAT 9.3 |
9.3M2 | August 2012 | STAT 12.1 |
9.4 | July 2013 | STAT 12.3 |
9.4M1 | December 2013 | STAT 13.1 |
9.4M2 | August 2014 | STAT 13.2 |
9.4M3 | July 2015 | STAT 14.1 |
9.4M4 | November 2016 | STAT 14.2 |
9.4M5 | September 2017 | STAT 14.3 |
9.4M6 | November 2018 | STAT 15.1 |
9.4M7 | August 2020 | STAT 15.2 |
市场和竞品
- SAP BusinessObjects
- IBM Cognos
- SPSS Modeler
- Oracle Hyperion
- Microsoft Power BI
- Stata
软件介绍
SAS系统由数十个专用模块构成, 广泛应用在金融, 医学和其他的科学行业, 可以说一个医院或公司如果没有SAS, 绝对不是一个正规的大公司. SAS虽然功能齐全且强大, 但是使用和操作上却十分的简便和灵活, 用户不必掌握非常高深的编程技巧, 只需要能够知道大多数的基础就能够很好的进行使用.
SAS 9.4
SAS9.4 是一个比较常见的版本, 这个版本可以在windows上单机部署, 也可以部署在服务器上. SAS9.4除了基础的Base SAS以外, 还有统计, 质量检测, 发展规划, 预测, 矩形运算等30多个模块, 是当前市场上统计分析软件的默认标准.
SAS系统由众多模块组成, 其中Base SAS模块是SAS系统的核心, 其它各模块均在Base SAS提供的环境中运行, 用户可选择需要的模块与Base SAS一起构成一个定制化的SAS系统, 以下为各模块功能介绍
Base SAS
Base SAS作为SAS系统的核心, 负责数据管理, 交互应用环境管理, 进行用户语言处理, 调用其它SAS模块.
Base SAS 为SAS系统的数据库提供了丰富的数据管理功能, 还支持标准的SQL语言对数据进行操作. Base SAS能够制作从简单列表到比较复杂的统计报表. Base SAS可进行基本的描述性统计及基相关系数的计算, 进行正态分布检验等.
SAS/ACCESS
为了对众多不同格式的数据进行查询, 访问和分析, SAS/ACCESS提供了与目前许多流行数据库软件的接口, 利用SAS/ACCESS, 可建立外部其它数据库的一个统一的公共数据界面. SAS/ACCESS提供的接口是透明的和动态的. 用户不必将此文件当作真正存储着数据的SAS数据集一样使用, 而只需在SAS中建立对外部的描述(即VIEW)文件, 便可将此文件当作真正存储着数据的SAS数据集一样使用. 对一些经常使用的外部数据, 可以利用SAS/ACCESS将数据真正提取进入SAS数据库. SAS/ACCESS 提供的接口是双向的, 既可将数据读入SAS, 也可在SAS中更新外部数据或将SAS数据加载到外部数据库中. 目前, SAS/ACCESS支持的数据库有: IML-DL/I, SQL/DS, DB2, ADABAS, Rdb, ORACLE, Sybase, INGRES, Informix, DBF/DIF, ODBC等.
SAS/STAT
SAS/STAT覆盖了所有的实用数理统计分析方法, 是国际统计分析领域的标准软件. SAS/STAT提供了十多个过程, 可进行各种不同模型或不同特点数据的回归分析, 如正交回归/面回归, 响应面回归, logistic回归, 非线性回归等, 且具有多种模型选择方法. 可处理的数据有实型数据, 有序数据和属性数据, 并能产生各种有用的统计量和诊断信息. 在方差分析方面, SAS/STAT为多种试验设计模型提供了方差分析工具. 另外, 它还有处理一般线性模型和广义线性模型的专用过程. 在多变量统计方面, SAS/STAT为主成分分析, 典型相关分析, 判别分析和因子分析提供了许多专用过程. SAS/STAT还包含多种聚类准则的聚类分析方法.
SAS/GHAPH
SAS/GHAPH可将数据及其包含着的深层信息以多种图形生动地呈现出来, 如直方图, 圆饼图, 星形图, 散点相关图, 曲线图, 三维曲面图, 等高线图及地理图等. SAS/GHAPH提供一个全屏幕编辑器, 提供多种设备程序, 支持非常广泛的图形输出设备以及标准的图形交换文件.
SAS/ASSIST
SAS/ASSIST为SAS系统提供了面向任务的菜单界面, 借助它可以通过菜单系统来使用SAS系统其它产品. 它自动生成的SAS程序既可辅助有经验的用户快速编写SAS程序, 又可帮助用户学习SAS.
SAS/AF
SAS/AF是一个应用开发工具. 用户使用SAS/AF可将包含众多功能的SAS软件作为方法库, 利用 SAS/AF的屏幕设计能力以及SCL语言的处理能力来快速开发各种功能强大的应用系统. SAS/AF也了采用了OOP(面向对象编辑)技术, 使用户可方便快速开发各类具有图形用户界面(GUI)的应用系统.
SAS/EIS
SAS/EIS是决策工具, 也是一个快速应用开发工具. SAS/EIS完全采用新兴的面向对象的编程模式(OOP). EIS以生动直观的方式(图或表)将关键性或总结性信息呈现给使用者.
SAS/QC
SAS/QC为全面质量管理提供了一系列工具. 它也提供一套全屏幕菜单系统引导用户进行标准的统计过程以及试验设计. SAS/QC提供了多种不同类型控制图的制作与分析. Pareto图(排列图)可用于发现需优先考虑的因素, Ishikawa图(鱼骨图)可用于直观地进行因果分析.
SAS/ETS
SAS/ETS提供丰富的计量经济学和时间序列分析方法, 是研究复杂系统和进行预测的有力工具. 它提供方便的模型设定手段, 多样的参数估计方法.
SAS/OR
SAS/OR提供全面的运筹学方法, 是一种强有力的决策支持工具. 它辅助人们实现对人力, 时间以及其它各种资源的最佳利用. SAS/OR包含通用的线性规划, 混合整数规划和非线性规划的求解, 也为专门的规划问题提供更为直接的解决办法, 如网络流问题, 运输问题, 分配问题等.
SAS/IML
SAS/IML提供功能强大的面向矩阵运算的编程语言, 帮助用户研究新算法或解决SAS中没有现成算法的专门问题. SAS/IML中的基本数据元素是矩阵. 它包含大量的数学运算符, 函数和例行程序, 用户用很少的语句便可执行很复杂的计算过程.
SAS/WA
SAS/WA(Warehouse Administrator)是建立数据仓库的集成工具, 它在其它SAS软件的基础上提供了一个建立数据仓库的管理层, 包括: 定义数据仓库和主题, 数据转换和汇总, 汇总数据的更新, Metadata的建立, 管理和查询, Data marts和Info marts的实现.
SAS/MDDB Server
SAS/MDDB Server是SAS的多维数据库产品, 主要用于在线分析处理(OLAP), 可将从数据仓库或其它数据源来的数据以立体阵列的方式存储, 以便于用多维数据浏览器等工具快速和方便地访问.
SAS/IntrNet
SAS/IntrNet为SAS Web应用提供了数据服务和计算服务, 包括htmSQL, 它为一UNIX Web服务器的CGI程序, 使得能通过支持Web浏览器动态查询SAS数据或外部的关系型数据库;SAS ODBC Driver使得能通过支持ODBC的Windows Web服务器来访问SAS数据;SAS Driver for JDBC使得可以通过Java applet来查询SAS数据; SAS/IntrNet Application Dispatcher使得可以通过Web浏览器动态地递交SAS程序到SAS应用服务器执行, 并将结果返回浏览器.
SAS/GIS
SAS/GIS集地理位置系统功能与数据的显示分析于一体. 它提供层次化的地理信息, 每一层可以是某些地理元素, 也可与用户定义的主题(例如: 人口, 产值等)相关联. 用户可交互式地缩小或放大地图, 设定各层次显示与否, 并利用各种交互式工具进行数据显示与分析.
SAS/ITSV
IT Service Vision(ITSV)是企业的全面IT服务的性能评估和管理的软件, 这些IT服务包括计算机系统, 网络系统, Web服务器和电话系统等. ITSV将不同来源的数据进行整理和组织, 存放于性能数据仓库中, 用GUI或批处理的方式产生组织任意层面的报告. 系统程序员及网络工程师能借此识别, 研究并解决有关问题, 业务分析人员能借此制定资源管理的总体策略, CIO和数据中心经理能借此定期地得到所需的IT运作的汇总和分析报告.
SAS/CFO Vision
SAS/CFO Vision用于财务整合和报告, 内部包含了会计知识, 为日常财务工作提供了现成的程序, 并提供了访问所有主要数据源的接口. 它主要用于;访问财务和非财务的有关住处整合财务数据, 通过一个财务信息仓库来管理业务结构, 通过财务报告和分析帮助理解财务的结果, 并在组织内交流关键的业务结果信息.
参考
- WIKIPEDIA上的SAS词条页 https://en.wikipedia.org/wiki/SAS_(software)
- SAS介绍和简单的代码, 线性回归例子, WEB应用, 印度英语 https://www.youtube.com/watch?v=6oeeedtz9Gg
- SAS介绍, SAS单机程序, Introduction to SAS Statistics https://www.youtube.com/playlist?list=PLjrXzkmqZGHLHg3SV3cY83bH59jnhuU60
SAS (Statistics Analysis System) 统计分析系统软件的更多相关文章
- Data analysis system
A data analysis system, particularly, a system capable of efficiently analyzing big data is provided ...
- Linux System Log Collection、Log Integration、Log Analysis System Building Learning
目录 . 为什么要构建日志系统 . 通用日志系统的总体架构 . 日志系统的元数据来源:data source . 日志系统的子安全域日志收集系统:client Agent . 日志系统的中心日志整合系 ...
- introduction to python for statistics,analysis笔记3
一.产生数组和矩阵 1.linspace(start,end,number),产生在start和end数之间number个数 >>> x = linspace(, , ) >& ...
- introduction to python for statistics,analysis笔记2
一.行列式连接concatenate函数,axis=0是垂直拼接,axis=1是水平拼接 x=np.array([[],[,]]); y=np.array([[],[,]]); z=np.concat ...
- 【分享】SAS统计分析软件学习教程电子书合集下载
SAS是著名的统计分析软件,全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件. 转 ...
- SAS数据挖掘实战篇【一】
SAS数据挖掘实战篇[一] 1数据挖掘简介 1.1数据挖掘的产生 需求是一切技术之母,管理和计算机技术的发展,促使数据挖掘技术的诞生.随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量.复 ...
- SPSS SAS 是什么?
SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件.最初软件全称为“社会科学统计软件包”(SolutionsStatisti ...
- Analysis of requirement specification of parking management system
Analysis of requirement specification of parking management system PURPOSE OF THE SYSTEM The parking ...
- sas教程
http://web5.pku.edu.cn/pucssr/SASbiancheng.pdf 本教程中的主题将向您介绍 SAS Enterprise Guide.您最好依次浏览这些主题. 概述 启动项 ...
- malware analysis、Sandbox Principles、Design && Implementation
catalog . 引言 . sandbox introduction . Sandboxie . seccomp(short for secure computing mode): API级沙箱 . ...
随机推荐
- 如何让Dec-C++支持C++11
1.问题 Dev-C++默认设置中是不支持C++11版本特性的,如Lambda表达式,nullptr等均不提供支持 2.解决 设置编译选项 编译时加上命令-std==c++11即可
- 【FreeRTOS】堆内存管理
动态内存分配及其与FreeRTOS的相关性 为了使FreeRTOS更易用,内核对象(如任务.队列.信号量.事件组)不在编译期静态分配,而是在运行时动态分配,FreeRTOS在内核对象创建时分配RAM, ...
- [转帖]git常用命令
https://www.cnblogs.com/xingmuxin/p/11416870.html GitHub可以托管各种git库,并提供一个web界面,但与其它像 SourceForge或Goog ...
- [转帖]Docker容器日志查看与清理(亲测有效)
1. 问题 docker容器日志导致主机磁盘空间满了.docker logs -f container_name噼里啪啦一大堆,很占用空间,不用的日志可以清理掉了. 2. 解决方法 2.1 找出Doc ...
- jmaps
#!/bin/bash # # jmaps - creates java /tmp/perf-PID.map symbol maps for all java processes. # # This ...
- 玩一玩 golang 1.21 的 pgo 编译优化
作者:张富春(ahfuzhang),转载时请注明作者和引用链接,谢谢! cnblogs博客 zhihu Github 公众号:一本正经的瞎扯 1.下载镜像 暂时不想替换本机的 golang 版本,于是 ...
- pycharm像vs那样进行代码折叠
在visual studio中可以使用#region和#endregion来进行代码折叠,我尝试在pycharm中也可以使用相同的指令来折叠代码. 但是如果#endregion是在方法的最后面或者类的 ...
- 数据挖掘机器学习[四]---汽车交易价格预测详细版本{嵌入式特征选择(XGBoots,LightGBM),模型调参(贪心、网格、贝叶斯调参)}
题目出自阿里天池赛题链接:零基础入门数据挖掘 - 二手车交易价格预测-天池大赛-阿里云天池 相关文章: 特征工程详解及实战项目[参考] 数据挖掘---汽车车交易价格预测[一](测评指标:EDA) 数据 ...
- 深度学习基础入门篇[二]:机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、ROUGE等详解
A.深度学习基础入门篇[二]:机器学习常用评估指标:AUC.mAP.IS.FID.Perplexity.BLEU.ROUGE等详解 1.基础指标简介 机器学习的评价指标有精度.精确率.召回率.P-R曲 ...
- 【三】tensorboard安装、使用教学以及遇到的问题
相关文章: [一]tensorflow安装.常用python镜像源.tensorflow 深度学习强化学习教学 [二]tensorflow调试报错.tensorflow 深度学习强化学习教学 [三]t ...