摘要: 从前的从前,我一直以为回车即换行,换行即回车. 这个"以为"维持了二十余年 今天在了解这些转义符时,发现我的知识库又少了别人一截: "回车"(carriage return)和"换行"(line feed)是两个不同的概念: 在很久很久以前,在计算机宝宝还没有出生之前,有一种叫做电传打字机(Tele 阅读全文
posted @ 2019-04-16 22:01 喜欢吃面的猪猪 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 写作背景: 看着别人的代码, 。Okay,本人宣告卡机~~ 百度后,好像知道了点什么。 其他编译语言经常出现def main(),然后写一大串代码,表示它把想要干的事情定义到了main()函数,以后想干啥,直接写个main(),就ok了。这些语言的运行,需要main()函数作为程序的入口,来实现程序 阅读全文
posted @ 2019-04-06 23:22 喜欢吃面的猪猪 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 回归,探讨的是自变量与因变量的关系(因果关系)。 通过回归技术,可知道自变量与因变量存在关系,且知道自变量对因变量的影响强度如何。 常见的有一元线性、多元线性回归方程,但因为存在不满足模型基本假设问题,我们的大神们陆续推出了岭回归、Lasso回归等等。 目录 : 一.线性回归 二.多项式回归 三.逐 阅读全文
posted @ 2019-03-09 16:57 喜欢吃面的猪猪 阅读(969) 评论(0) 推荐(0) 编辑
摘要: 一.缺失值 sklearn中的preprocessing下有imputer,可进官方文档参考。这里主讲pandas。 拿到数据,一般先检查是否有缺失值,用isnul()或notnull(). 再决定dropna(),还是fillna()。 1.1 检查是否有缺失值 isnull()、notnull( 阅读全文
posted @ 2019-03-06 23:12 喜欢吃面的猪猪 阅读(527) 评论(0) 推荐(0) 编辑
摘要: Pandas主要用来处理数据框或异质型数据。它有两种常用的数据结构:Series and Pandas。一般,我们这样调包: 一.Series 暂时搁置 二.DataFrame 2.1 创建DataFrame 2.1.1 以字典的形式创建 Altitude Block Color Damage Ex 阅读全文
posted @ 2019-03-06 17:59 喜欢吃面的猪猪 阅读(277) 评论(0) 推荐(0) 编辑
摘要: 我们一般会拿偏度和峰度来看数据的分布形态,而且一般会跟正态分布做比较,我们把正态分布的偏度和峰度都看做零。如果我们在实操中,算到偏度峰度不为0,即表明变量存在左偏右偏,或者是高顶平顶这么一说。 一.偏度(Skewness) Definition:是描述数据分布形态的统计量,其描述的是某总体取值分布的 阅读全文
posted @ 2019-03-04 23:13 喜欢吃面的猪猪 阅读(23198) 评论(0) 推荐(2) 编辑
摘要: 持续优化中~~~ 背景: 中国电子商务的发展在全球范围内,处于遥遥领先的位置。在特定节日,如双十一,更是吸引了外国大批的消费者疯狂下单抢购。现随着各大平台的兴起,平台越来越正规化,卖家要懂得利用各方资源,来弥补自身的不足,不断提高商品的曝光率。随着国内一二线城市网购渗透率接近饱和,在未来,三四线城市 阅读全文
posted @ 2019-02-19 22:04 喜欢吃面的猪猪 阅读(2914) 评论(0) 推荐(0) 编辑
摘要: 持续优化中~~~ 研究背景: 中国制酒历史源远流长,品种繁多,名酒荟萃,享誉中外。其中,黄酒跟白酒是两种主要的酒类。它们渗透于中华民族的源远流长的文明史中,对文学创作、文化娱乐、饮食文化的影响更是起到一个重要作用。但是,随着全球化的脚步,我们的生活中渐渐出现了红葡萄酒、白葡萄酒。喝葡萄酒渐渐成为一种 阅读全文
posted @ 2019-02-18 20:08 喜欢吃面的猪猪 阅读(8964) 评论(4) 推荐(2) 编辑
摘要: 一.定义 主成分分析(principal components analysis)是一种无监督的降维算法,一般在应用其他算法前使用,广泛应用于数据预处理中。其在保证损失少量信息的前提下,把多个指标转化为几个综合指标的多元统计方法。这样可达到简化数据结构,提高分信息效率的目的。 通常,把转化生成的综合 阅读全文
posted @ 2019-02-12 13:48 喜欢吃面的猪猪 阅读(2225) 评论(0) 推荐(0) 编辑
摘要: sklearn实现 归类为5大类 sklearn.preprocessing.scale()(最常用,易受异常值影响) sklearn.preprocessing.StandardScaler() sklearn.preprocessing.minmax_scale()(一般缩放到[0,1]之间,若 阅读全文
posted @ 2019-02-11 20:47 喜欢吃面的猪猪 阅读(5846) 评论(0) 推荐(1) 编辑