摘要: 本文根据网络资源和书籍结合自己的经验对SAS的常用函数进行了整理。主要内容包括: 1. 字符函数 2. 日期和时间函数 3. 数组函数 4. 数学函数 5. 样本描述统计函数 6. 特殊函数 7. 随机数函数 8. 宏函数 9. 变量信息函数 10.分布密度函数、分布函数 11.分位数函数 一、字符 阅读全文
posted @ 2018-05-12 15:34 宇宙超人 阅读(16914) 评论(0) 推荐(0) 编辑
摘要: 一、sas 宏变量 1) 宏变量属于SAS宏语言,与普通变量的区别是可以独立于DATA步 2) 可以再SAS程序中除数据行之外的任何地方定义并使用宏变量 3) %let语句定义宏变量并分配一个值给宏变量(如:%let dsn=3) 4) 当引用一个宏变量的值,放&号在宏变量前 5) 使用%str函数 阅读全文
posted @ 2018-05-12 12:55 宇宙超人 阅读(3011) 评论(0) 推荐(0) 编辑
摘要: 一、 sql语句的执行顺序 1、 sql语句一共分为11步,如下所标注的那样,最先执行的总是FROM操作,最后执行的是LIMIT操作。 2、 其中每一个操作都会产生一张虚拟的表,这个虚拟的表作为一个处理的输入,只是这些虚拟的表对用户来说是透明的,就只有最后一个虚拟的表才会被作为结果返回。 Ps: ( 阅读全文
posted @ 2018-05-12 10:13 宇宙超人 阅读(478) 评论(0) 推荐(1) 编辑
摘要: 环境:Win8.1 TensorFlow1.0.0 软件:Anaconda3 (集成Python3及开发环境) TensorFlow安装:pip install tensorflow (CPU版) pip install tensorflow-gpu (GPU版) TensorFlow是一个非常强大 阅读全文
posted @ 2018-02-09 16:06 宇宙超人 阅读(1900) 评论(0) 推荐(0) 编辑
摘要: 机器学习算法可以通过学习就可以弄清楚如何去执行一些重要的任务。在手动编程不可行的情况下,这种方法通常既可行又经济有效。随着可获取的数据在逐步增多,越来越多更加复杂的问题可以用机器学习来解决。事实上,机器学习已经被广泛的运用到计算机以及一些其他领域。然而,开发出成功的机器学习应用需要大量的“black 阅读全文
posted @ 2018-02-05 17:32 宇宙超人 阅读(924) 评论(0) 推荐(0) 编辑
摘要: 作者:景略集智链接:https://zhuanlan.zhihu.com/p/33594845 文本数据无处不在 不管你身处已经开张的公司还是即将开展的新业务,都可以利用文本数据去验证、优化和扩展产品性能。而从文本数据中学习和提取价值的研究科学就叫做自然语言处理(NLP)。 NLP 每天都能产生新奇 阅读全文
posted @ 2018-02-05 17:12 宇宙超人 阅读(341) 评论(0) 推荐(0) 编辑
摘要: 参考:Udacity ML纳米学位 1. 取样 数据量很大的时候,想要先选取少量数据来观察一下细节。 indices = [100,200,300] # 把sample原来的序号去掉重新分配 samples = pd.DataFrame(data.loc[indices], columns = da 阅读全文
posted @ 2018-02-05 16:58 宇宙超人 阅读(234) 评论(0) 推荐(0) 编辑
摘要: sparse matrix稀疏矩阵不同的存储形式在sparse模块中对应如下: bsr_matrix(arg1[, shape, dtype,copy, blocksize]) Block Sparse Row matrix coo_matrix(arg1[, shape, dtype,copy]) 阅读全文
posted @ 2018-02-04 15:53 宇宙超人 阅读(6672) 评论(0) 推荐(0) 编辑
摘要: 目前为止,CNNs (卷积神经网络)仍是最先进的图像分类识别方法。 简单来讲,CNNs 通过逐层累加调整实现分类。它首先检测到边缘,然后是形状,然后是实际的识别对象。CNN 的实现方式极具创新,然而在这一过程中却有一项重要的信息丢失了——特征之间的空间关系。下面是一个 CNN 工作原理的简化描述: 阅读全文
posted @ 2018-02-04 15:47 宇宙超人 阅读(806) 评论(0) 推荐(0) 编辑
摘要: 引言 如果你对机器学习算法已经很熟悉了,但是有时候你的模型并没有很好的预测效果或者你想要追求更好地模型性能。那么这篇文章会告诉你一些最实用的技术诊断你的模型出了什么样的问题,并用什么的方法来解决出现的问题,并通过一些有效的方法可以让你的模型具有更好地性能。 介绍数据集 这个数据集有569个样本,它的 阅读全文
posted @ 2018-01-30 11:33 宇宙超人 阅读(269) 评论(0) 推荐(0) 编辑