听见涛声_数说张小桃

日拱一卒 | 梳理、沉淀、数据科学家踩坑之路 | 努力成为数据分析领域python最强的人

导航

2019年8月23日 #

如何提高效率?

摘要: 工作、学习、生活的矛盾点——>时间——>提高效率 如何提高效率? 吸收前人成果,避免重复劳动——>拿来主义 好记性不如烂笔头,做好笔记定期整理,遗忘会让所有投入白白浪费——>做好笔记 迭代思维,把完美主义放到最后——>迭代思维 多和同事交流,别人的一句话可能让你节约数小时——>多多交流 ps:无论怎 阅读全文

posted @ 2019-08-23 10:41 数说张小桃 阅读(144) 评论(0) 推荐(0) 编辑

2019年8月19日 #

区别 |python |[-1]、[:-1]、[::-1]、[2::-1]的使用

摘要: 格式 list[start :end :方向] start——>开始下标位置 end——>结束下标位置 方向——> 读取方向。默认正向,-1表示反方向读取 list[start :end :方向] start——>开始下标位置 end——>结束下标位置 方向——> 读取方向。默认正向,-1表示反方向 阅读全文

posted @ 2019-08-19 09:36 数说张小桃 阅读(1053) 评论(0) 推荐(0) 编辑

2019年8月13日 #

区别 |DCL |DDL |DML |DQL

摘要: DCL(Data Control Language)数据控制语言: 用来设置或更改数据库用户或角色权限的语句,包括(grant,deny,revoke等)语句。这个比较少用到。 对于大多数人,在公司一般情况下我们用到的是DDL、DML、DQL这三种。 DDL(data definition lang 阅读全文

posted @ 2019-08-13 11:13 数说张小桃 阅读(123) 评论(0) 推荐(0) 编辑

2019年8月5日 #

案例 |练习 |双11电商打折套路解析

摘要: 分析目标 看看淘宝的商家双11参与热情怎么样,是否真的有打折,给的折扣力度怎么样 思路分解 part1、双11商家参与热情怎么样?(双11当天在售+预售) 看双11当天在售商品的数量及比例情况 看双11当天在售商品的品牌数量及比例 双11当天未在售的商品,前后动向会如何,会有哪些特征?(临时下架?预 阅读全文

posted @ 2019-08-05 15:33 数说张小桃 阅读(370) 评论(0) 推荐(0) 编辑

区别 |python-pandas库set_index、reset_index用法区别

摘要: 1、set_index() 作用:DataFrame可以通过set_index方法,将普通列设置为单索引/复合索引。 格式:DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False 阅读全文

posted @ 2019-08-05 10:52 数说张小桃 阅读(13788) 评论(1) 推荐(0) 编辑

2019年7月30日 #

python数据读取路径为啥要用双反斜杠?

摘要: Window下python读取数据路径可以有三种表示方式: (1)'c:\\a.txt' ——>转义的方式。表示这里\\是一个普通\字符,不容易出错(2)r'c:\a.txt' ——>声明字符串。表示不需要转义,因此这里\ 就是一个普通反斜杠字符(推荐) (3)'c:/a.txt' ——>直接用正斜 阅读全文

posted @ 2019-07-30 00:58 数说张小桃 阅读(13356) 评论(1) 推荐(1) 编辑

2019年7月26日 #

Jupyter notebook文件默认存储路径以及更改方法

摘要: 1、文件默认存储路径怎么查? 安装Anaconda后,新建文件的默认存储路径一般在C系统盘,那么路径是什么呢? 首先,新建一个.ipynb文件, 输入以下脚本,运行出的结果即是当前jupyter文件默认保存路径 import os print(os.path.abspath('.')) 2、 文件默 阅读全文

posted @ 2019-07-26 22:36 数说张小桃 阅读(144543) 评论(10) 推荐(20) 编辑

2019年7月19日 #

极大似然估计

摘要: 【1】极大似然估计详解,写的太好了!https://blog.csdn.net/qq_39355550/article/details/81809467 阅读全文

posted @ 2019-07-19 18:51 数说张小桃 阅读(148) 评论(0) 推荐(0) 编辑

2019年7月18日 #

初识Qgis

摘要: 折腾了一天,qgis终于能在跟了自己8年的本本上顺利打开了,官网先后下载了3.8和3.4版本的都出现了同样的问题,"could not load qgis_app.dll",google也发现很多人遇到同样问题,试了几个都不行。最后在百度经验https://jingyan.baidu.com/art 阅读全文

posted @ 2019-07-18 00:06 数说张小桃 阅读(879) 评论(0) 推荐(0) 编辑

2019年6月12日 #

特征向量&特征值及其应用

摘要: 大学学习线性代数的时候,特征值(eigenvalue)和特征向量(eigenvector)一直不甚理解,尽管课本上说特征值和特征向量在工程技术领域有着广泛的应用,但是除了知道怎么求解特征值和特征向量之外,对其包含的现实意义知之甚少。 毕业五六年后,学习机器学习,用到PCA在进行主成分分析过程中,需要 阅读全文

posted @ 2019-06-12 10:55 数说张小桃 阅读(8241) 评论(2) 推荐(6) 编辑

2019年5月21日 #

练习 |委托方在每个月重复委案率

摘要: 数据: 案件清单表(vi_cs_rpt_cse_dtl)是汇总了每个甲方案件的一些案件信息——按照委托方、合同号、批次号、委案开始日期这4要素为唯一标示。包含的主要字段(委托方、合同号、批次号、委案开始日期、委案金额、委案结束日期,导案操作时间) 题目: 若本月甲方给到案件导入系统之后,对于同个委托 阅读全文

posted @ 2019-05-21 15:19 数说张小桃 阅读(297) 评论(0) 推荐(0) 编辑

2019年5月15日 #

区别 |峰度(Kurtosis)和偏度(Skewness)

摘要: 峰度(Kurtosis) 定义 峰度又称峰态系数,表征概率密度分布曲线在平均值处峰值高低的特征数,即是描述总体中所有取值分布形态陡缓程度的统计量。直观看来,峰度反映了峰部的尖度。这个统计量需要与正态分布(也叫常态分布)相比较。 公式 定义上峰度是样本的标准四阶中心矩(standardized 4rd 阅读全文

posted @ 2019-05-15 21:11 数说张小桃 阅读(64767) 评论(0) 推荐(1) 编辑

matplotlib 画图颜色参数值及对应色卡

摘要: matplotlib 色卡对应参数值 seaborn 的色卡对应参数值 装了seaborn扩展的话,在字典seaborn.xkcd_rgb中包含所有的xkcd crowdsourced color names。使用的代码 【参考】 【1】(原)python中matplotlib的颜色及线条控制 阅读全文

posted @ 2019-05-15 20:37 数说张小桃 阅读(17630) 评论(0) 推荐(3) 编辑

colormap 参数及对应色卡

摘要: 【参考】 【1】matlab帮助文档 阅读全文

posted @ 2019-05-15 20:21 数说张小桃 阅读(1611) 评论(0) 推荐(0) 编辑

2019年5月14日 #

Jupyter NoteBook输出的图表太小看不清怎么办?

摘要: 如果使用的是matplotlib绘图,可以通过以下命令更改图片的大小: %matplotlib linline 如果是 plt.figure(figsize=(5,3)) #其中(5, 3)用于控制图片的大小 如果是 fig,axes = plt.subplots(2 ,3 ,figsize=(12 阅读全文

posted @ 2019-05-14 11:40 数说张小桃 阅读(2014) 评论(0) 推荐(0) 编辑

2019年5月13日 #

区别 |柱状图(条形图)和直方图

摘要: 柱状图=条形图 直方图 阅读全文

posted @ 2019-05-13 23:05 数说张小桃 阅读(9024) 评论(0) 推荐(1) 编辑

2019年5月12日 #

jupyter|魔法函数问题| UsageError: Line magic function `%` not found

摘要: 问题: jupyter notebook 使用魔法函数% matplotlib inline,报错:UsageError: Line magic function `%` not found 解决: 1、百度上最容易找到的解决方案如下,但是anaconda promot 打开用 conda inst 阅读全文

posted @ 2019-05-12 08:37 数说张小桃 阅读(17772) 评论(4) 推荐(2) 编辑

2019年5月9日 #

p分位数的原理及计算

摘要: p分位数的原理及计算 大纲>> 1.统计上的分位数概念 2.分位数的计算方法及举例 2.1首先确定p分位数的位置(依据项数分为基数、偶数情况) 2.2 求上一步确定的p分位数位置处的具体值 3.python中的分位数计算 1.统计上的分位数概念 统计上,分位数亦称分位点,是指将一个随机变量的概率分布 阅读全文

posted @ 2019-05-09 13:24 数说张小桃 阅读(6117) 评论(0) 推荐(1) 编辑

2018年5月10日 #

技巧-如何通过hive开发平台上传csv文件

摘要: 通过数据交换平台上传较大的文件时,经常会出现导入失败情况,换种方式通过新数据开发平台(stark)也可以轻松实现外部数据与hive的数据关联。 第一步、导入csv文件到hive stark数据开发平台——>资源管理——>搜索栏右边+号——>上传资源(资源类型:选择普通文件) stark数据开发平台— 阅读全文

posted @ 2018-05-10 17:23 数说张小桃 阅读(749) 评论(2) 推荐(0) 编辑