2019年2月9日
摘要: 笔记13:数据描述——集中趋势(一般水平)、离散趋势(波动水平)、频数分布、交叉分布 (一)衡量集中趋势主要指标:均值(AVERAGE)、中位数(MEDIAN)、众数(MODE) (二)衡量离散趋势主要指标:极差(RANGE)(最大值减最小值)、方差(VAR)(各数据与均值差的平方的平均数)、标准差 阅读全文
posted @ 2019-02-09 21:30 JRxxxx 阅读(295) 评论(0) 推荐(0) 编辑
  2019年2月3日
摘要: 笔记12:P942.数据加工——数据抽取、排序、分组 (一)数据抽取——字段分列、合并、匹配 1、字段分列、合并是互逆的过程 ①合并: ②分列:=MID(提取谁,从第几个字符开始,提取机个字符) 阅读全文
posted @ 2019-02-03 10:22 JRxxxx 阅读(232) 评论(0) 推荐(0) 编辑
  2019年1月19日
摘要: 笔记11 数据清洗三步骤——查重、改缺、纠错。 1、查重:选中数据所在区域——开始——条件格式——突出显示单元格规则——重复值 2、改缺:(1)查找空值:选中区域——F5——定位条件——空值 (2)处理缺失值(缺失值一定是空值,而空值不一定是缺失值):①漏录还是漏答——补充即可;②将有缺失值的记录删 阅读全文
posted @ 2019-01-19 19:02 JRxxxx 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 笔记9:P868 开放题编码步骤——录入、去重、归类、编码、两次VLOOKUP (1)去重的四种方法——Countif、高级筛选、条件格式、数据透视表 高级筛选 (2)编码:VLOOKUP 注解: C1——查找对应C1中内容的编码,返回到D1单元格 E:F——在E与F列中查找对应的编码 2——F相对 阅读全文
posted @ 2019-01-19 18:29 JRxxxx 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 笔记8 数据查询网络资源 表5-1 分析方法与报告的网站汇总 网站 网址 说明 人大经 济论坛 bbs.pinggu.org 有免费报告,但多需论坛币。资料含金量较高,有统计年鉴以及国内外知名咨询公司的报告 新浪爱问 http://ishare.iask.sina.com.cn/ 比较喜欢,东东很多 阅读全文
posted @ 2019-01-19 17:12 JRxxxx 阅读(324) 评论(0) 推荐(0) 编辑
  2019年1月13日
摘要: 因为机构改革事宜,加班加了两个多月,周末的研究生课程一半都没有上。《利用python进行数据分析》也一直没再学下去,换了一本《数据分析:企业的贤内助》在看,想先对数据分析工作有一个整体的、全面的了解,再去学习技术。就转为从记录本书的学习开始吧。注:采用微信读书APP阅读,页码以此APP为准。 笔记1 阅读全文
posted @ 2019-01-13 23:35 JRxxxx 阅读(353) 评论(0) 推荐(0) 编辑
  2018年12月13日
摘要: 1、本书要求下载epd_free-7.3-1-win-x86.msi的安装包,否则会和书中的案例不一样。在Enthought官网上找了半天没找到,最后才明白epd现在已经更名为canopy。 2、顺利下载到epd_free后,又发现之前安装过Python,还是3.6.5版本,怎样进行环境配置也忘记了 阅读全文
posted @ 2018-12-13 21:30 JRxxxx 阅读(218) 评论(0) 推荐(0) 编辑