摘要:
当SAS的过程步达到一定量的时候,中间总会有一些临时数据集,如果想要查看临时数据集的信息,有哪些途径呢: 1.直接将临时数据集打印出来: procprint data=temp; run; 2.需要查看的是多个数据集呢: 先在当前文件夹下建立一个新的文件夹:BAK LIBNAME BAK './BA 阅读全文
摘要:
最近在处理数据量较大的项目时,应用到index索引与HASH对象的结合使用,总结一下对index作为建索引的相关知识点 1.概念 索引:索引是一种辅助的数据结构,通过一个或者多个关键变量来直接指向观测。SAS索引有两类,简单索引:只基于一个变量的值,索引名自动等于关键变量名;复合索引:基于多于一个的 阅读全文
摘要:
问题:RMA上部署规则经常出现java版本过期等问题解决该问题分为两步:1.将本机中的JDK卸载,安装32位的7_80版本的JDK,并配置环境变量(自行查找系统环境配置) 2.IE10,将版本切换到IE9,IE8,均有以下问题:“JAVA已被阻止,因为它已过时并且需要更新” 只需点击这次运行,可部署 阅读全文
摘要:
options validvarname=any;/*因为excel中的名字存在空格等*//*写入excel,class,air,bei分别是test.xlsx中的表名*/libname s xlsx './test.xlsx';data s.class; set sashelp.class;run 阅读全文
摘要:
SAS编码方式 %PUT %SYSFUNC(getOption(ENCODING)); EUC-CN SAS内存应用的最高限度%PUT %SYSFUNC(getoption(MEMSIZE)); 2147483648 这应该是字节,2G 阅读全文
摘要:
HASH的正常使用是要求唯一的key,但如果想使用相同关键值key,参考https://wenku.baidu.com/view/2cc9b821a1c7aa00b42acba0.html 举例如下(应用:多对多的表关联): data testdup(index=(key));length key 阅读全文
摘要:
数据量比较大时,需要拆分数据集,再批量计算执行; 数据简单描述:多个cell_phone,每条cell_phone 对应多条other_cell_phone,需要大致均等拆分10份%INCLUDE "..\00@Common\01@header\01@Header.sas"; PROC SORT D 阅读全文
摘要:
处理千万观测数据的小伙伴,辛苦等了一两个小时,结果发现以下报错,心如死灰: ERROR: 内存失败时,Hash 对象添加了 4587504 个项。 FATAL: 内存不足,无法执行 DATA 步程序。 在“EXECUTION”阶段中止。ERROR: 由于内存不足,SAS 系统停止了对该步的处理。NO 阅读全文
摘要:
需求求字符型格式的日期相差6个月的日期 DATA A;X='20151207';Y=INPUT(X,YYMMDD8.);Z=PUT(INTNX('MONTH',Y,6,'s'),YYMMDDN8.);PUT X= Y= Z=;RUN; 结果:X=20151207 Y=20429 Z=20160607 阅读全文
摘要:
已经用HASH 计算衍生变量好几天了,今天突然觉悟般的领会到hash 里面h.clear的作用。 有这样的一个数据(伪造):几千万条记录,report_id是每个人的唯一标识,每个人贷款多笔,querier是查询机构,query_reason是审批原因,还有等等数据; 需求是:计算每个人贷款审批机构 阅读全文