SAS进阶《深入解析SAS》之开发多语言支持的SAS程序
SAS进阶《深入解析SAS》之开发多语言支持的SAS程序
1. 多语言支持的应用程序是指该程序在世界给第使用时,其能够处理的数据,以及处理数据的方式、信息展现的方式都符合当地的语言、文化习惯,这要求应用程序运行时,能够自动进行与地区、语言相关的处理,也就是通常所说的国际化。
2. SBCS、DBCS、MBCS
单字节字符集SBCS指在该字符集中的字符最多由2个字节表示。一个字节8位,仅支持2的8次方=256个码点。
双字节字符集DBCS(Doule-Byte Character Set)指该字符中的字符最多由2个字节表示。
多字节字符集MBCS(Multiple-Byte Character Set)是指该字符集中的字符以多个字节来表示。如UTF-8.
3. 指定系统选项的LOCALE=
在启动SAS时,相应的Locale会在启动时加载的SAS配置文件中指定。
4. 编码选项ENCODING=
SAS提供了系统选项ENCODING=以及一些数据集选项、逻辑库选项和读写文件选项,便于灵活地出各种编码的数据。
(1)会话编码(2)SAS数据集的编码(3)读写外部文件(4)排序序列(SORT默认的排序是二进制排序)
5. 使用SORTREQ=指定其他排序序列的基本形式如下:
PROC SORT DATA=数据集 SORTSEQ=转换表|编码|LIGNUISTIC;
RUN;
6. 语言切换选项
从SAS9.3开始,引入了语言切换(Language Switching)选项,并且在SAS9.4中得到了增强。
7. SAS提供了NL格式(format)和NL输入格式(informat),这些格式能够根据运行的SAS会话的语言/区域来转换日期、日期时间、货币和数字的格式。
8. FORMAT自定义格式,还可以通过指定选项LOCALE来定义只能在指定的Locale下可用的格式。
/*
根据美国和中国的对身高的不同标准
运行该代码会在逻辑库sas的物理路径下生产两个文件formats.sas7bcat和formats_zh_cn.sas7bcat
*/
proc format lib=saslib.formats;
value size
low - 56 = 'Short'
56 - 66 = 'Medium'
66 - high = 'Tall';
run;
options locale=zh_CN;
proc form lib=saslib.formats locale;
value size
low - 50 = '偏瘦'
50 - 60 = '中等'
60 - high = '偏高'
run;
/*
接下来按Locale使用逻辑库saslib中的格式size.,代码如下:
*/
option fmtsearch=(saslib/locale);
proc print data=sashelp.class(obs=5);
format height size.;
run;
9. 字符串和字符处理函数
SAS提供了字符串函数和CALL例程,以使用户能够很容易地处理字符数据。K函数。
K函数使用以字符为基础的偏移长度,可用于处理SBCS、DBCS、MBCS(UTF-8)数据,使用K函数更加符合语言处理习惯,而且不需要知道每个字符存储为多少个字节。
10. 文本字符串外部化
为了使同一个SAS程序能支持多种语言,需要将代码中的文本字符串提取出来,并在需要使用该字符串的地方使用其通用的表示方式,该过程称为字符串外部化(String Externalizatin)。
步骤:
(1)第一步:抽取字符串并生成.smd文件
(2)第二步:根据.msd文件创建数据集
(3)第三步:在SAS代码中获取字符串
/*
保证所有文本在不同的Locale下以对应的语言显示,包括页眉、页脚、标签等,目前需要支持英文和简体中文。
*/
/*
第一步创建myapp_zh_CN.smd,使用Unicode转义字符,将utf-8原文件转换成Uncode
*/
%macro SMD2ASCII(inf=,outf=,inencoding=,lrecl=);
data _null_;
attrib tmp length=$ &lrecl;
infile "&inf" lrecl=&lrecl;
input;
file "&outf" lrecl=&lrecl;
tmp = kpropdata(_infile_,"uesc","&inencoding","ascii");
put tmp;
run;
%mend SMD2ASCII;
%SMD2ASCII(inf = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd\myapp_han.smd,
outf = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd\myapp_zh_CN.smd,
inencoding = utf-8,
lrecl = 300);
/*
第二步根据.smd文件创建数据集
*/
%SMD2DS(dir = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd,
basename = myapp,
locale = zh_CN,
lib = saslib);
/*
在使用SASMSG函数从消息数据集中获取文本字符串
*/
%let ds=saslib.myapp;
%let user=SBJKUX;
%let adate=%sysfunc(today(),nldate.);
proc datasets library=saslib nolist;
modify order_summay;
label Qountry = %sysfunc(sasmsg(&ds,Country_Label,noquote));
label Quantity = %sysfunc(sasmsg(&ds,Quantity_Label,noquote));
label Price = %sysfunc(sasmsg(&ds,Price_Label,noquote));
run;
title %sysfunc(sasmsg(&ds,Report_Title,noquote));
footnote %sysfunc(sasmsg(&ds,Report_Fn,noquote,'&adate',&user));
proc report data=saslib.sales;
run;
SAS进阶《深入解析SAS》之开发多语言支持的SAS程序的更多相关文章
- C#如何开发多语言支持的Winform程序
C# Winform项目多语言实现(支持简/繁/英三种语言)有很多种方案实现多语言,我在这里介绍一种最简单最容易理解的,作为教学材题应该从通俗易懂入手.在写这篇文章之前,本来想用枚举窗体对象成员的方式 ...
- SAS进阶《深入解析SAS》之对多数据集的处理
SAS进阶<深入解析SAS>之对多数据集的处理 1. 数据集的纵向串接: 数据集的纵向串接指的是,将两个或者多个数据集首尾相连,形成一个新的数据集. 据集的横向合并: 数据集的横向合并,指 ...
- SAS进阶《深入解析SAS》之SAS数据挖掘的一般流程
SAS进阶<深入解析SAS>之SAS数据挖掘的一般流程 1. 所谓数据挖掘,是指通过对大量的数据进行选择.探索与建模,来揭示包含在数据中以前不为人所知的模式或规律,从而为商业活动或科学研究 ...
- SAS进阶《深入解析SAS》之Base SAS基础、读取外部数据到SAS数据集
SAS进阶<深入解析SAS>之Base SAS基础.读取外部数据到SAS数据集 前言:在学习完<SAS编程与商业案例>后,虽然能够接手公司的基本工作,但是为了更深入的SAS学习 ...
- SAS进阶《深入分析SAS》之数据汇总和展现
SAS进阶<深入分析SAS>之数据汇总和展现 1. 通过Print过程制作报表 proc print <data=数据集>; run; 选项: obs=修改观测序号列标签 no ...
- Java进阶(三)多线程开发关键技术
原创文章,同步发自作者个人博客,转载请务必以超链接形式在文章开头处注明出处http://www.jasongj.com/java/multi_thread/. sleep和wait到底什么区别 其实这 ...
- “指定的SAS安装数据(sid)文件不能用于选定的SAS软件订单
Sas安装指南,若拿到可用的sid文件,需要做如下修改. 使用新sid的时候,“指定的SAS安装数据(sid)文件不能用于选定的SAS软件订单”问题解决: 1.进入sas安装包,install_doc ...
- 全网最热Python3入门+进阶 更快上手实际开发✍✍✍
全网最热Python3入门+进阶 更快上手实际开发 整个课程都看完了,这个课程的分享可以往下看,下面有链接,之前做java开发也做了一些年头,也分享下自己看这个视频的感受,单论单个知识点课程本身没问 ...
- Android(java)学习笔记219:开发一个多界面的应用程序之两种意图
1.两种意图: (1)显式意图: 在代码里面用intent设置要开启Activity的字节码.class文件: (2)隐式意图: Android(java)学习笔记218:开发一个多界面的应用程序之人 ...
随机推荐
- 关于字符串不为空 错误:s!=null
错误:s!=null 正确:StringUtils.isNotBlank(s); public static boolean isBlank(CharSequence cs) { int strLen ...
- Convolutions in TensorFlow
Convolutions in TensorFlow Convolutions without training You might already be familiar with the term ...
- print pdf bug & DOCTYPE
print pdf bug & DOCTYPE OK with <!DOCTYPE html> <!DOCTYPE html> <html lang=" ...
- [luoguP1507] NASA的食物计划(DP)
传送门 二位费用背包 ——代码 #include <cstdio> #include <iostream> int n, maxv, maxw; ][]; inline int ...
- Cx的治疗
题目背景 「Cx的故事」众所周知,Cx是一个宇宙大犇.由于Cx在空中花园失足摔下,导致他那蕴含着无穷智慧的大脑受到了严重的损伤,许多的脑神经断裂.于是,Cx的wife(有么?)决定请巴比伦最好的医师治 ...
- BZOJ(2) 1041: [HAOI2008]圆上的整点
1041: [HAOI2008]圆上的整点 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 4966 Solved: 2258[Submit][Sta ...
- FTP用户-禁止登录系统
OS是Ubuntu 11.10. 1. which nologin #/usr/sbin/nologin 2. vim /etc/shells #在该文件后添加/usr/sbin/nolo ...
- Codeforces 577E Ann and Half-Palindrome 字典树
题目链接 题意: 若一个字符串是半回文串.则满足第一位和最后一位相等, 第三位和倒数第三位相等.如此类推. 给定一个字符串s,输出s的全部子串中的半回文串字典序第k大的 字符串. good[i][j] ...
- Android Studio最新配置教程2016
http://blog.csdn.net/wen_demo 一.Android studio 基本简单介绍 1.Android studio和Eclipse的差别: 1.Studio中有Project ...
- P4111 [HEOI2015]小Z的房间 生成树计数
这个题是生成树计数的裸题,中间构造基尔霍夫矩阵,然后构成行列式,再用高斯消元就行了.这里高斯消元有一些区别,交换两行行列式的值变号,且消元只能将一行的数 * k 之后加到别的行上. 剩下就没啥了... ...