• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






小和山

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2019年12月19日

关联分析
摘要: 学习目标:熟练掌握购物车分析法的三个维度,并结合维恩图来进行有效分析。同时,能够采用卡方检验来做有效验证。 一、作用 关联分析的主要作用,在于研究两个产品之间是否存在关联。如果确实存在关联性,则可以通过产品组合来达到更佳的效果。 例如:在超市中,买方便面的人常常会顺带买“泡面伴侣”火腿肠,说明方便面 阅读全文
posted @ 2019-12-19 13:10 小和山 阅读(974) 评论(0) 推荐(0)
 

2019年12月13日

因子分析
摘要: 学习目标:熟练使用主成分分析法对自变量进行降维,了解因子旋转的作用,能够对新生成的自变量进行合理解释,进而纳入线性回归模型比较拟合效果。 一、作用 因子分析,通过提取主成分的方式来减少自变量的数量,达到消除多重共线性的效果。 例如,某个餐厅的营业额(y)受到“x1.公交站点广告”、“x2.电台广告” 阅读全文
posted @ 2019-12-13 17:49 小和山 阅读(1113) 评论(0) 推荐(0)
 
RFM模型
摘要: 学习目标:熟练应用RFM模型对客户进行分类,找出新客户以及高价值的客户,并根据流失率快速找出容易流失的客户。 1、RFM的含义 R (Recency):客户最近一次交易时间的间隔。R值越大,表示客户交易发生的日期越久,反之则表示客户交易发生的日期越近。 F (Frequency):客户在最近一段内交 阅读全文
posted @ 2019-12-13 17:07 小和山 阅读(929) 评论(0) 推荐(0)
 

2019年10月23日

Pandas 入门
摘要: Series 基本概念,创建 Series 一维数组 ten ten <bound method Series.rename of a 10 b 10 c 10 d 10 e 10 Name: ten, dtype: int64> 索引位置下标,标签索引,切片索引,布尔型索引 1 # 位置下标 跟序 阅读全文
posted @ 2019-10-23 16:32 小和山 阅读(142) 评论(0) 推荐(0)
 
numpy入门
摘要: numpy 数组的运算 多维的数组对象, 简称ndarray array([ 0, 1, 2, ..., 9997, 9998, 9999]) # linspace(): 返回在间隔[开始,停止]上 num个均匀间隔的样本 np.linspace(2.0,3.0, num=5) np.linspac 阅读全文
posted @ 2019-10-23 00:16 小和山 阅读(99) 评论(0) 推荐(0)
 

2019年10月18日

matplotlib 入门
摘要: 为什么要学习matplotlib 1.能将数据进行可视化,更直观的呈现 2.使数据更加客观,更具说服力 什么是matplotlib matplotlib:最流行的Python底层绘图库,主要做数据可视化图表,模仿MATLAB创建 基础绘图 案例 假设一天中每隔两个小时(range(2,26,2))的 阅读全文
posted @ 2019-10-18 15:57 小和山 阅读(237) 评论(1) 推荐(0)
 

2019年9月27日

0基础带你认识爬虫
摘要: 爬虫一、认识爬虫1、概念口语化定义:网络爬虫,程序,自动,批量,下载网络资源。专业角度:伪装成客户端与服务端进行数据交互的程序2.相关概念2.1应用架构(软件的结构是什么样子的)- c /s client server 客户端,服务端架构(比如lol,qq)- b /s browser 浏览器服务器 阅读全文
posted @ 2019-09-27 23:06 小和山 阅读(365) 评论(0) 推荐(0)