摘要: 为了逼自己写完这系列笔记,先把整体框架放上。课程来自网易爱数圈陈哲老师的《数据分析师的通过升级》,陈哲老师也出过一些书,都比较接地气,大家可以多多支持。在同期小同学的强烈推荐下,我打算笔记输出整个课程。课程总共分为5个部分。 界定分析问题:数据分析师在开始分析工作前,应该怎么挖掘客户的难题、痛点、需 阅读全文
posted @ 2020-06-18 17:15 ceeyo 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 备注:原创转载请注明出处,数据来源蝉妈妈 阅读全文
posted @ 2020-05-30 08:42 ceeyo 阅读(291) 评论(0) 推荐(0) 编辑
摘要: Table of Contents 1 背景知识1.1 何为LCV?1.2 何为用户流失率1.3 为什么流失率很重要?1.4 常用的流失率统计1.5 如何分析用户流失?1.6 如何分析用户流失?2 spark分析案例简介3 spark分析案例详细解3.1 导入需要的库3.2 数据洞察和清洗3.2.1 阅读全文
posted @ 2020-05-21 20:15 ceeyo 阅读(984) 评论(0) 推荐(0) 编辑
摘要: 文章地址:http://blog.csdn.net/heyongluoyao8/article/details/49408319 前言 本文主要解释一些关于机器学习模型评价的主要概念,与评价中可能会遇到的一些陷阱。如训练集 验证集二划分校验(Hold out validation)、交叉校验(Cro 阅读全文
posted @ 2020-04-06 12:17 ceeyo 阅读(1305) 评论(0) 推荐(0) 编辑
摘要: 数据探索综合指南 苏尼尔·雷( SUNIL RAY) 2016年1月10日 总览 有关数据探索(EDA)的完整教程 我们涵盖了数据探索的几个方面,包括缺失值估算,异常值去除和特征工程的技巧 介绍 没有数据浏览的捷径。如果您处于一种状态,那么机器学习可以使您摆脱每次数据风暴,相信我,事实并非如此。经过 阅读全文
posted @ 2020-04-04 04:57 ceeyo 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-03-15 20:07 ceeyo 阅读(2347) 评论(2) 推荐(0) 编辑
摘要: INSERT INTO Book(bid, bName, price, bTypeId) VALUES(2, '射雕英雄传', 39.62, 10); INSERT INTO Book(bid, bName, price, bTypeId) VALUES(3, '天龙八部', 50.02, 10); 阅读全文
posted @ 2020-03-05 00:13 ceeyo 阅读(431) 评论(0) 推荐(0) 编辑
摘要: CREATE TABLE dept ( deptno INT COMMENT "部门编号", NAME VARCHAR (20) COMMENT "部门名称", loc VARCHAR (40) COMMENT "所在城市" ) charset = utf8; INSERT INTO dept VA 阅读全文
posted @ 2020-03-04 18:39 ceeyo 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 按如下代码: import matplotlib.pyplot as plt %matplotlib inline from pylab import *plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes. 阅读全文
posted @ 2019-12-12 12:47 ceeyo 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 强烈推荐可以在线编译,适合初学者: https://github.com/jvns/pandas-cookbook 阅读全文
posted @ 2019-11-29 15:40 ceeyo 阅读(140) 评论(0) 推荐(0) 编辑