摘要: 根据上一篇下载的数据,现在每天更新day数据 需要保证股票当日新上市下载,退市保留,停牌复牌识别、是否发生复权(决定前复权价格是否变化) 数据更新 1、大盘指数数据(399001, 399005, 399006, 399300,999999) 2、A股股票数据与概括文件 阅读全文
posted @ 2017-12-23 17:50 坴戋 阅读(1551) 评论(0) 推荐(0) 编辑
摘要: 存储为3个文件夹:大盘数据、股票数据与概括文件 数据获取来源:股票数据来源于R中的WindR;大盘数据来源于python中的tushare(wind中指数似乎只有中证板块) 设置数据文件夹,代码中只需修改更新截止日期与工作路径,后面创建文件都无需手动操作 文件夹中文件不能随意变动,标红代码部分需要自 阅读全文
posted @ 2017-12-23 17:37 坴戋 阅读(2513) 评论(0) 推荐(0) 编辑
摘要: 一、国内股票历史数据 1. Python中tushare包 get_hist_data:此接口仅能获取最近三年的未复权数据,数据源来自新浪财经,但其获取速度不受限制 get_hist_data:此接口仅能获取最近三年的未复权数据,数据源来自新浪财经,但其获取速度不受限制 get_h_data:此接口 阅读全文
posted @ 2017-12-06 14:02 坴戋 阅读(9105) 评论(0) 推荐(0) 编辑
摘要: path 5000) useful.day 5000) index2012 <- array(dim=c(length(useful.day), 2)) for(i in useful.day){ index2012[which(i == useful.day), ] <- c(i, which(data[[i]][ , 5006] != "")[1]) } # 某些天不... 阅读全文
posted @ 2017-10-23 11:02 坴戋 阅读(199) 评论(0) 推荐(0) 编辑
摘要: R需要包:Rwordseg包、rJava包 需要知识:正则表达式、配置Java环境 通过爬虫某热门微博评论得到五万余条数据,对其进行文本挖掘和数据分析 爬虫使用Python,分析使用R。与他人合作所做,本人负责数据处理,故此处仅说明分析 练习来源于想在某条微博上找到某个人,仅知其手机型号和评论内容, 阅读全文
posted @ 2017-07-24 21:04 坴戋 阅读(352) 评论(0) 推荐(0) 编辑
摘要: logistic回归、SVM、AUC、ROC 阅读全文
posted @ 2017-07-17 23:46 坴戋 阅读(515) 评论(0) 推荐(0) 编辑
摘要: 视频笔记 随手记,仅供个人查阅 1. kaggle比赛 2. 发布结果的平台:GitHub,RPubs 3. 发布文件 README.md:introduction(dataset, variables...), loading the data, making plots 4. Google,St 阅读全文
posted @ 2017-07-14 19:06 坴戋 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 搜索笔记 上课笔记 线性拟合 回归的本质:E(Y|X1, ……Xp) QQ图:残差作Y,正态分布随机数作X,看是否在一条直线上 回归的本质:E(Y|X1, ……Xp) QQ图:残差作Y,正态分布随机数作X,看是否在一条直线上 Logit回归评判效果好坏可用用 ROC曲线与AUC,TPR,FPR(tr 阅读全文
posted @ 2017-07-14 18:46 坴戋 阅读(215) 评论(0) 推荐(0) 编辑