09 2017 档案
摘要:options validvarname=any;/*因为excel中的名字存在空格等*//*写入excel,class,air,bei分别是test.xlsx中的表名*/libname s xlsx './test.xlsx';data s.class; set sashelp.class;run
阅读全文
摘要:SAS编码方式 %PUT %SYSFUNC(getOption(ENCODING)); EUC-CN SAS内存应用的最高限度%PUT %SYSFUNC(getoption(MEMSIZE)); 2147483648 这应该是字节,2G
阅读全文
摘要:HASH的正常使用是要求唯一的key,但如果想使用相同关键值key,参考https://wenku.baidu.com/view/2cc9b821a1c7aa00b42acba0.html 举例如下(应用:多对多的表关联): data testdup(index=(key));length key
阅读全文
摘要:数据量比较大时,需要拆分数据集,再批量计算执行; 数据简单描述:多个cell_phone,每条cell_phone 对应多条other_cell_phone,需要大致均等拆分10份%INCLUDE "..\00@Common\01@header\01@Header.sas"; PROC SORT D
阅读全文
摘要:处理千万观测数据的小伙伴,辛苦等了一两个小时,结果发现以下报错,心如死灰: ERROR: 内存失败时,Hash 对象添加了 4587504 个项。 FATAL: 内存不足,无法执行 DATA 步程序。 在“EXECUTION”阶段中止。ERROR: 由于内存不足,SAS 系统停止了对该步的处理。NO
阅读全文
摘要:需求求字符型格式的日期相差6个月的日期 DATA A;X='20151207';Y=INPUT(X,YYMMDD8.);Z=PUT(INTNX('MONTH',Y,6,'s'),YYMMDDN8.);PUT X= Y= Z=;RUN; 结果:X=20151207 Y=20429 Z=20160607
阅读全文
摘要:已经用HASH 计算衍生变量好几天了,今天突然觉悟般的领会到hash 里面h.clear的作用。 有这样的一个数据(伪造):几千万条记录,report_id是每个人的唯一标识,每个人贷款多笔,querier是查询机构,query_reason是审批原因,还有等等数据; 需求是:计算每个人贷款审批机构
阅读全文
摘要:IF _N_=1 THEN DO; DCL HASH H(ORDERED:'YES'); H.DEFINEKEY('VAR1'); H.DEFINEDATA(VAR2); H.DEFINEDONE(); CALL MISSING(VAR1,VAR2); END; HASH处理完数据集,导致第一条观测
阅读全文
摘要:在实践从地址中提取省份时,发现HASH没作用? DATA D.T1(KEEP= PROVINCE REPORT_ID GET_DATE ADDRESS); SET D.T; IF _N_=0 THEN SET S.PROVINCE_1;/*该数据集包含所有省份简称P_1 和省份全称PROVINCE*
阅读全文
摘要:全角转为半角 ADDRESS=KTRANSLATE(ADDRESS,'1234567890()','1234567890()'); ADDRESS=KTRANSLATE(ADDRESS,'ABCDEFGHIJKLMNOPQRSTUVWXYZ','ABCDEFGHIJKLMNOPQRSTUVWXYZ'
阅读全文