摘要: Pandas: numpy处理的是数值型数据,pandas可以帮助处理除了数值型数据外的数据(字符串,时间序列) Pandas模块常用的两个类:Series, DataFrame Series是一种类似于一维数组的对象,由values:一组数据(ndarray类型) 和 index: 相当于数据索引 阅读全文
posted @ 2021-02-04 23:40 正在学Python 阅读(98) 评论(0) 推荐(0) 编辑
摘要: Numpy Numerical Python 是python语言中做科学计算的基础库,重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型,多维数组上执行的数值运算。 数组和列表的区别:数组中存储的数据元素类型必须统一,如果有不统一按照优先级统一;’优先级:字符串>浮点型>整数 1. 阅读全文
posted @ 2021-02-04 17:19 正在学Python 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 数据分析课程目录 第1篇:EXCEL数据分析 实战案例:如何使用EXCEL进行数据分析 EXCEL公式函数 第2篇:业务指标和分析方法 RFM模型 第3篇:MYSQL数据查询 第4篇:统计学基础 统计学基础-数值型数据 统计学基础-分类数据统计 相关分析 回归分析 第5篇:SPSS,Tableau制 阅读全文
posted @ 2021-02-04 11:34 正在学Python 阅读(635) 评论(0) 推荐(0) 编辑
摘要: def rfm_func(x): level = x.map(lambda x:'1' if x>=0 else '0') label = level.R + level.F + level.M d = { '111':'重要价值客户', '011':'重要保持客户', '101':'重要挽留客户' 阅读全文
posted @ 2020-12-04 15:33 正在学Python 阅读(429) 评论(0) 推荐(0) 编辑
摘要: 今天,收到了一个来自深圳的视频面试。 这家企业自称做猎头和人才推荐,和很多软件外包公司都有合作。现主要推荐ETL工程师。 给我面试的小姐姐说:看了我的简历,建议往ETL发展,技术上面公司可以提供免费培训,时长20天,培训结束后,公司给我包装简历,然后给我推荐外包公司,不出意外两周内我就能通过面试走上 阅读全文
posted @ 2020-11-24 21:42 正在学Python 阅读(2822) 评论(4) 推荐(0) 编辑
摘要: Markdown使用的符号: 井号,星号,大于号,中括号,竖线,横杠,波浪线,反引号 # ,*, > ,【】,|,-,~,` 井号 井号+ 空格:根据空格的个数显示各标题的大小,如果省事可以使用ctrl+1~6设置各级标题,如下面的1-5级标题 标题一 标题二 标题三 标题四 标题五 大于号 表示一 阅读全文
posted @ 2020-11-23 23:03 正在学Python 阅读(408) 评论(0) 推荐(0) 编辑
摘要: jupyter的基本使用 启动:在终端中录入:jupyter notebook的指令,按下回车 新建: python3:anaconda中的一个源文件 cell有两种模式: code:编写代码 markdown:编写笔记 快捷键: 添加cell:a或者b 删除:x 修改cell的模式: m:修改成m 阅读全文
posted @ 2020-11-23 21:15 正在学Python 阅读(453) 评论(0) 推荐(0) 编辑
摘要: 回归分析是研究变量间函数关系的一种方法。 变量之间的关系可以表示为方程的形式: • 因变量 • 自变量 回归模型的作用: 预测和解释 阅读全文
posted @ 2020-11-22 23:09 正在学Python 阅读(570) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-11-22 20:35 正在学Python 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 1 分类数据的描述统计 分类数据的基本描述方式 频数列表 百分比 累计频数 累计百分比 众数 2 分类数据的推断统计 对于分类数据而言,我们如果想检验变量之间是否存在某种关系,那这个就要用到 检验了 什么是卡方检验呢 对分类数据的频数进行分析的统计方法 3.根据样本统计量公式计算结果 阅读全文
posted @ 2020-11-22 17:14 正在学Python 阅读(519) 评论(0) 推荐(0) 编辑