如何解决数据分析中的粗心问题

摘要: 解决粗心的方法论:事前计划--》 事后检查--》按照顺序 转载请注明出处:http://www.cnblogs.com/SSSR/p/6930883.html 粗心是一个很严重的问题,不是无关痛痒的问题。细节决定成败并不是一句空谈。 解决方法: 1.在数据分析的全过程尽量使用代码来完成减少excel 阅读全文
posted @ 2017-06-01 21:40 徐长卿学数据分析 阅读(600) 评论(0) 推荐(0) 编辑

sas宏变量与数据集之间的交互

摘要: 在目前的数据处理过程中,我们面对的处理对象主要是二位数据表即sas数据集,但是我们在写宏程序时,宏变量和红参数又是字符串的形式,所以我们需要探讨一下宏变量和红参数怎么和数据集之间进行交互。 将数据集集名、变量名、变量值、变量label、变量类型等以单个值或者多个值拼接的形式传给宏变量。 将宏变量的值 阅读全文
posted @ 2017-05-26 16:11 徐长卿学数据分析 阅读(2336) 评论(1) 推荐(0) 编辑

sas调整数据集变量顺序

摘要: sas调整数据集变量顺序,更改列顺序,更改列的排列。 Python和R在进行变量顺序修改时特别方便,但是sas的keep并不支持变量顺序修改,只能用retain来进行修改,而且修改使用的方法是将所有的变量名重新排列一遍。 如果变量特别多会非常麻烦,利用宏变量其实是程序拼接的思想,试用宏变量来实现。 阅读全文
posted @ 2017-05-26 13:27 徐长卿学数据分析 阅读(2756) 评论(0) 推荐(0) 编辑

要嵌入到场景上信息才有意义

摘要: 群里看大家聊天。 问只知道身份证号能做哪些分析, 一群友说: 还要看这个东西的应用场景了。比如一家劳动密集型企业内某一地区的人员占比过高,会不会形成帮派,对管理造成一定困难(打架斗殴)等等。 另一群友总结:要嵌入到场景上信息才有意义。 阅读全文
posted @ 2017-05-26 11:59 徐长卿学数据分析 阅读(200) 评论(0) 推荐(0) 编辑

关于sas宏的一点想法

摘要: 有人说把sas宏比作其他语言的函数,但是我做此类比的时候陷入了死胡同,没有成功,举一例,如果是函数就要有返回值,sas宏的返回又是什么。而且sas宏涉及到编译阶段,导致很难理解。 直到看到了一个人说,宏是帮你写程序的程序,才有那么点感觉。 如果真的是这样,我们的程序其实就是一段文本,传给后台,然后运 阅读全文
posted @ 2017-05-25 20:51 徐长卿学数据分析 阅读(1733) 评论(0) 推荐(0) 编辑

sas使用proc report实现同比 环比 占比。顺带实现了sql的窗口函数

摘要: 使用sas实现同比 环比 占比,其中环比和占比是使用proc report实现的,环比使用data步实现,但是其中每年的总计是使用proc report来实现的。 proc report 可以实现proc print proc tabluate proc sort proc means 以及data 阅读全文
posted @ 2017-05-25 16:40 徐长卿学数据分析 阅读(2045) 评论(0) 推荐(0) 编辑

关于数据挖掘和数据分析的一点迷思!

摘要: 关于数据分析和数据挖掘学习的一点迷思 可能有些数据挖掘工程师的工作就是研究算法研究数学,不需要他们去做数据清洗,做报表展示类的工作,这类就是大牛了,不需要再读下去了 关于数据这条路大家的一致认为业务和数学是很重要的,一切的分析思路和算法都要结合业务来做,算法(数学)是内功; 但是这两点对于普通人来说 阅读全文
posted @ 2017-03-20 20:23 徐长卿学数据分析 阅读(422) 评论(0) 推荐(0) 编辑

golang中使用selenium进行爬虫

摘要: selenium本来是用来做自动测试,但是因为可以模拟浏览器操作,所以也可以用来做爬虫(尤其是一些比较变态登陆网站,又不会模拟登陆的),只是速度会比较慢。 转载请注明出处:http://www.cnblogs.com/SSSR/p/6390229.html 经验总结: 1、火狐浏览器在运行较长时间后 阅读全文
posted @ 2017-02-12 19:30 徐长卿学数据分析 阅读(10360) 评论(1) 推荐(0) 编辑

SAS关于宏、宏函数、宏变量、data步、proc步和call execute的理解

摘要: SAS宏和宏函数的问题困扰了我三年之久,终于在昨日想通了,而想通的原因也很搞笑,仅仅是当时意识到了sas宏和宏函数是两个东西,自定的宏并不是宏函数(在其他编程语言中自定义函数和语言本身函数是一样的,受此影响!) 转载请注明出处:http://www.cnblogs.com/SSSR/p/638095 阅读全文
posted @ 2017-02-09 11:09 徐长卿学数据分析 阅读(3200) 评论(0) 推荐(0) 编辑

golang基础--slice和array

摘要: 在 Go 语言中数组是固定长度的数据类型,它包含相同类型的连续的元素,这些元素可以是内建类型,像数字和字符串,也可以是结构类型,元素可以通过唯一的索引值访问,从 0 开始。 一旦数组被声明了,那么它的数据类型跟长度都不能再被改变。如果你需要更多的元素,那么只能创建一个你想要长度的新的数组,然后把原有 阅读全文
posted @ 2017-01-26 18:53 徐长卿学数据分析 阅读(190) 评论(0) 推荐(0) 编辑