喜欢吃面的猪猪

2019年4月16日

摘要：从前的从前，我一直以为回车即换行，换行即回车. 这个"以为"维持了二十余年今天在了解这些转义符时，发现我的知识库又少了别人一截： "回车"（carriage return）和"换行"（line feed）是两个不同的概念：在很久很久以前，在计算机宝宝还没有出生之前，有一种叫做电传打字机（Tele 阅读全文

posted @ 2019-04-16 22:01 喜欢吃面的猪猪阅读(276) 评论(0) 推荐(0) 编辑

2019年4月6日

if __name__ == "__main__"

摘要：写作背景：看着别人的代码，。Okay,本人宣告卡机~~ 百度后，好像知道了点什么。其他编译语言经常出现def main(),然后写一大串代码，表示它把想要干的事情定义到了main()函数，以后想干啥，直接写个main(),就ok了。这些语言的运行，需要main（）函数作为程序的入口，来实现程序阅读全文

posted @ 2019-04-06 23:22 喜欢吃面的猪猪阅读(182) 评论(0) 推荐(0) 编辑

2019年3月9日

回归方法及其拓展

摘要：回归，探讨的是自变量与因变量的关系（因果关系）。通过回归技术，可知道自变量与因变量存在关系，且知道自变量对因变量的影响强度如何。常见的有一元线性、多元线性回归方程，但因为存在不满足模型基本假设问题，我们的大神们陆续推出了岭回归、Lasso回归等等。目录：一.线性回归二.多项式回归三.逐阅读全文

posted @ 2019-03-09 16:57 喜欢吃面的猪猪阅读(969) 评论(0) 推荐(0) 编辑

2019年3月6日

Pandas 数据清洗常用篇

摘要：一.缺失值 sklearn中的preprocessing下有imputer，可进官方文档参考。这里主讲pandas。拿到数据，一般先检查是否有缺失值，用isnul()或notnull(). 再决定dropna()，还是fillna()。 1.1 检查是否有缺失值 isnull()、notnull( 阅读全文

posted @ 2019-03-06 23:12 喜欢吃面的猪猪阅读(527) 评论(0) 推荐(0) 编辑

Pandas 基础

摘要： Pandas主要用来处理数据框或异质型数据。它有两种常用的数据结构：Series and Pandas。一般，我们这样调包：一.Series 暂时搁置二.DataFrame 2.1 创建DataFrame 2.1.1 以字典的形式创建 Altitude Block Color Damage Ex 阅读全文

posted @ 2019-03-06 17:59 喜欢吃面的猪猪阅读(277) 评论(0) 推荐(0) 编辑

2019年3月4日

数据的偏度和峰度——df.skew()、df.kurt()

摘要：我们一般会拿偏度和峰度来看数据的分布形态，而且一般会跟正态分布做比较，我们把正态分布的偏度和峰度都看做零。如果我们在实操中，算到偏度峰度不为0，即表明变量存在左偏右偏，或者是高顶平顶这么一说。一.偏度（Skewness） Definition:是描述数据分布形态的统计量，其描述的是某总体取值分布的阅读全文

posted @ 2019-03-04 23:13 喜欢吃面的猪猪阅读(23198) 评论(0) 推荐(2) 编辑

2019年2月19日

女包销量预测分析

摘要：持续优化中~~~ 背景：中国电子商务的发展在全球范围内，处于遥遥领先的位置。在特定节日，如双十一，更是吸引了外国大批的消费者疯狂下单抢购。现随着各大平台的兴起，平台越来越正规化，卖家要懂得利用各方资源，来弥补自身的不足，不断提高商品的曝光率。随着国内一二线城市网购渗透率接近饱和，在未来，三四线城市阅读全文

posted @ 2019-02-19 22:04 喜欢吃面的猪猪阅读(2914) 评论(0) 推荐(0) 编辑

2019年2月18日

白葡萄酒质量评分预测分析

摘要：持续优化中~~~ 研究背景：中国制酒历史源远流长，品种繁多，名酒荟萃，享誉中外。其中，黄酒跟白酒是两种主要的酒类。它们渗透于中华民族的源远流长的文明史中，对文学创作、文化娱乐、饮食文化的影响更是起到一个重要作用。但是，随着全球化的脚步，我们的生活中渐渐出现了红葡萄酒、白葡萄酒。喝葡萄酒渐渐成为一种阅读全文

posted @ 2019-02-18 20:08 喜欢吃面的猪猪阅读(8964) 评论(4) 推荐(2) 编辑

2019年2月12日

主成分分析 —PCA

摘要：一.定义主成分分析（principal components analysis)是一种无监督的降维算法，一般在应用其他算法前使用，广泛应用于数据预处理中。其在保证损失少量信息的前提下，把多个指标转化为几个综合指标的多元统计方法。这样可达到简化数据结构，提高分信息效率的目的。通常，把转化生成的综合阅读全文

posted @ 2019-02-12 13:48 喜欢吃面的猪猪阅读(2225) 评论(0) 推荐(0) 编辑

2019年2月11日

数据规范化——sklearn.preprocessing

摘要： sklearn实现归类为5大类 sklearn.preprocessing.scale()（最常用，易受异常值影响） sklearn.preprocessing.StandardScaler() sklearn.preprocessing.minmax_scale()（一般缩放到[0,1]之间，若阅读全文

posted @ 2019-02-11 20:47 喜欢吃面的猪猪阅读(5846) 评论(0) 推荐(1) 编辑

喜欢吃面的Hush

公告