摘要:
简单函数定义:函数归一化(后边例子中要用到) 斐波那契数列 导入导出 TXT: 安装扩展包 CSV文件的导入导出与TXT一致(要安装扩展包) XML文件 安装扩展包 Jason文件类似于XML,安装Jason,引用 MySQL数据库 install.packages('RMySQL') > head 阅读全文
摘要:
网上查到的个人认为最简洁的大纲,如果你有Python基础,又有些数学基础,看这个就够了。看不懂的地方敲一遍,这篇文章能告诉我们numpy是什么、它能做什么、怎么做。 NumPy NumPy是高性能科学计算和数据分析的基础包。部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省 阅读全文
摘要:
对于数据分析的同学来讲,要做的深入,R和Python是要会一个的,那零基础怎么学呢?https://www.codecademy.com/ 是个不错的选择,它会以介绍、让你练习、练习通过进入下一步(或者自己挑选某个章节)的方式进行练习,不会给你答案,要么正确通过,要么就放在那里,直到你会,可以清楚地 阅读全文
摘要:
数据源:1、约300名代理商(销售)在移动端CRM中产生的客户数据、以及此平台中其它渠道产生的客户数据2、经营分析平台相关数据3、公众号、网上商城、第三方在线教育平台等产生的数据 机构介绍: 产品为单次消费制(有复训收费制度,但复训发生周期较长),不是按不同时间周期续费制的产品 常规分析:一、产品偏 阅读全文
摘要:
举例:爬取带有“数据分析”职位的信息 需要材料:Python、 pip install requestspip install lxml pip install pandas 第一步:引用 第二步:找到可打开的正确的url 第三步:向这个URL发出请求,文本编码修改为中文字符 第四步:在原网址查看所 阅读全文
摘要:
目的:分析用户产品偏好支持产品区域化精准推送 所需数据:用户基本信息(区域、购买行为明细),所购产品利率(利率、次数)、担保机构(担保机构名称、次数)、产品期限(不同期限对应次数) 一、分析思路 1、分利率:统计每个用户投资不同利率产品的次数,依此计算用户对不同产品的选择比例(若利率选择较多,可分区 阅读全文
摘要:
思考:红包敏感程度一般从红包使用率、使用个数综合考虑,加息券类似。(若还想考虑对投资金额的影响可以把红包使用对应投资金额纳入分析范围) 一、数据源类型 二、对数据进行聚类(可分为4类、8类进行分析)不再演示,根据分类结果进行以下几个维度的分析 即将考虑的两个维度的数据复制到SPSS进行数据标准化,再 阅读全文
摘要:
RFM重要价值客户:recently、频次frequency、money金额 (也可利用作图软件将所有用户作三维散点图,再切割对应维度获得重要价值客户) 一、进行聚类 数据源(加上数据提取日) log方法减少量纲,不log进行标准化也行,两次处理量纲影响降到最低 数据贴入SPSS,进行标准化,k-m 阅读全文
摘要:
一、层次聚类(系统聚类) 原理:合并法(分解法方向相反算法相同,SPSS只提供合并法) 1、将每一个样本作为一类,如果是k个样本就分k成类 2、按照某种方法度量样本之间的距离,并将距离最近的两个样本合并 为一个类别,从而形成了k-1个类别 3、再计算出新产生的类别与其他各类别之间的距离,并将距离最近 阅读全文
摘要:
假设数据源如下 可分析维度发散 阅读全文