摘要: 异常值:是理论上不可能出现的值,肯定是错的 平滑:实际有可能出现的噪音 归一化:数值归一化到0-1之间 每个点都有多种方法 阅读全文
posted @ 2017-11-27 23:49 悟法悟天 阅读(2346) 评论(0) 推荐(0) 编辑
摘要: 滤波,少数很高或很低的点,会对曲线形成向上或向下的突刺,这时候使用平滑方法,使得得到新的曲线相对平稳,为了反应出整体的趋势 比如股市K线中的多少日均线 阅读全文
posted @ 2017-11-27 23:32 悟法悟天 阅读(908) 评论(0) 推荐(0) 编辑
摘要: 随机森林就是包含多个子决策树的模型,但是如何构建是有讲究的: 比如森林包含n个子决策树,这些决策树的模型是 一样的 训练样本随机抽样: 将一个大样本,通过随机抽取的办法,形成n个子样本,样本见元素可以重复 特征随机抽样: 特征也随机抽样,某个子决策树,使用部分特征,可以重复 这些随机抽样的目的是使不 阅读全文
posted @ 2017-11-27 16:46 悟法悟天 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 连续分布:关心一段取值范围内的概率,而不是某个x值对应概率,函数是概率密度,需要求积分才能得到一段范围内的概率 正态分布 为什么正态分布式很常见:http://www.ruanyifeng.com/blog/2017/08/normal-distribution.html 中心极限定理,多个独立变量 阅读全文
posted @ 2017-11-27 16:09 悟法悟天 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 饮食 少吃辣,冷,烫,多,少,快 每天两杯蜂蜜水,温水冲服,不要喝太多 锻炼 游泳 休息 晚上十二点前必须睡觉 阅读全文
posted @ 2017-11-27 15:24 悟法悟天 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 了解方法和算法 了解开源库和框架 了解业务 能从数据中发现一些问题,对数据进行初步统计 阅读全文
posted @ 2017-11-27 15:21 悟法悟天 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 如果不集中配置,而是散落在很多台机器上, 那么如果以后换人了,很可能找不到某条短信是在哪台机器上配置的 阅读全文
posted @ 2017-11-27 09:59 悟法悟天 阅读(173) 评论(0) 推荐(0) 编辑