摘要:
终于找到了python版BTYD包(lifetimes),果断拿来用用,想当初还自己对着R的BTYD包仿照写算法代码 包含有各种关于用户生命周期的包: customer lifetime value, clv, ltv, BG/NBD, pareto/NBD, frequency, recency 阅读全文
摘要:
Logistic模型原理,求解参数过程以及用例: 整个求解过程,就是用前一期的参数来求下一期的参数 用例,代码 待继续。。。。。 阅读全文
摘要:
互联网购物基本是一种非契约型协议,顾客的购买行为均具有随机性和不可预测性,那如何在此激烈的网络市场立于不败之地, 那就应该尽可能的降低网络顾客的流失率。 目前用于预测顾客流失率的模型有: SVM模型,Logistics模型,Pareto/NBD模型,BG/NBD模型以及引申的各类模型,通过结合分类模 阅读全文
摘要:
Scrapy爬虫框架: 包含如下主要文件: 例如爬取XX网站公司信息 当在在终端指定位置创建 爬虫工程,如上文件均都会存在: scrapy startproject lagouScrapy scrapy.cfg: 阅读全文
摘要:
法一:采用factor_analyzer模块方法: from factor_analyzer import factor_analyzer # KMO值print round(factor_analyzer.calculate_kmo(X_basic)[1],5)# 巴特利特球形度值print ro 阅读全文
摘要:
<代码已经过期,其中爬虫链接已经失效> 一:马科维茨投资组合理论 投资组合(Portfolio)是由投资人或金融机构所持有的股票、债券、衍生金融产品等组成的集合。投资组合的目的在于分散风险,投资组合按粗略的分类有三种不同的模式可供运用,即积极的、中庸的和保守的。 投资组合理论[1]:若干种证券组成的 阅读全文
摘要:
本文主要是通过交互项,和信息准则AIC,BC以及显著性来确定最优的回归模型: library(MASS) library(leaps) ## 1: 导入数据:主要变量为E1-E4,剩余变量为:G1-G20 datas<-read.csv(file="data.csv",header=TRUE) da 阅读全文
摘要:
library(plm) library(psych) library(xts) library(tseries) library(lmtest) ## import dataset datas<-read.table("data.txt",header =TRUE) ## adf test pcg 阅读全文
摘要:
#### 一:时间序列图 # 商品房销售价格指数的时间序列图 library(psych) #绘制时序图 x<-ts(y, frequency =1, start=c(2004),end=c(2016)) plot(x) #1阶差分,并绘制出差分后序列的时序图 y.dif<-diff(x) plot 阅读全文
摘要:
递归检验, 对2007 年 5 月-2009 年 8 月,2007 年 5 月-2009 年 9 月...... 2007 年 5 月-2019 年 1 月依次进行含有截距项和趋势项的 ADF 检验(采用R 语言脚本运行),其结构断点趋势图如下: d<-read.csv("test.csv",hea 阅读全文