2018年4月10日

摘要: char 一个字节,存储一个字符值。字符文字用单引号写成:'A' unsigned char 无符号,一个字节 byte 一个字节,无符号数, int 2字节,这产生-32768至32767的范围。 unsigned int 2字节,无符号,0到65535(2^16)-1。 long 4字节,从-2 阅读全文
posted @ 2018-04-10 11:24 Stephenatalie 阅读(427) 评论(0) 推荐(0) 编辑

2018年3月7日

摘要: Arrays.toString(arr) //常用 for(int n: arr) System.out.println(n+", "); for (int i = 0; i < arr.length; i++) { System.out.print(arr[i] + ", "); } System 阅读全文
posted @ 2018-03-07 09:47 Stephenatalie 阅读(132) 评论(0) 推荐(0) 编辑

2018年1月30日

摘要: 上数据挖掘课的时候算过GINI指数,在寻找降维算法的时候突然看到了信息增益算法,突然发现信息增益算法和课上算的GINI指数很相似,于是就用在这次文本分类实验当中。总的来说信息增益算法是为了求特征t对于分类的贡献大小。贡献大则称信息增益大、贡献小信息增益小。文本分类自然是找那些对分类贡献大的词汇了。。 阅读全文
posted @ 2018-01-30 08:45 Stephenatalie 阅读(2517) 评论(0) 推荐(0) 编辑

2018年1月28日

摘要: 作用: 聚合是为了解决查询在运行时的效率低下,在数据立方体部署的时候进行聚合,实际上是对数据立方体的预处理,方便以后查询。如若在部署时未进行聚合,则在以后每次查询时实际上都会进行一次集合的操作,等待结果时间长,cpu负担大。所以聚合是为提高查询效率而在大量聚合操作和运行时处理复杂度之间的权衡。 使用 阅读全文
posted @ 2018-01-28 17:01 Stephenatalie 阅读(502) 评论(0) 推荐(0) 编辑

2017年12月2日

摘要: liblinear是libsvm的线性核的改进版本,专门适用于百万数据量的分类。正好适用于我这次数据挖掘的实验。 liblinear用法和libsvm很相似,我是用的是.exe文件,利用python的subprocess向控制台发送命令即可完成本次试验。 其中核心两句即 train train.tx 阅读全文
posted @ 2017-12-02 21:20 Stephenatalie 阅读(4195) 评论(0) 推荐(0) 编辑

2017年11月19日

摘要: 绝对路径 os.path.abspath("文件名") 参数可为“”即当前路径 相对路径 os.path.dirname("文件名") 参数可为“”即当前路径 阅读全文
posted @ 2017-11-19 10:24 Stephenatalie 阅读(1108) 评论(0) 推荐(0) 编辑

2017年11月11日

摘要: ./tools/ subset.py 分割数据集 grid.py 优化参数c、g checkdata.py 检测数据集格式 easy.py 综合 ./windows/ svm-scale.exe 规范化 svm-train.exe 训练模型 svm-pridict.exe 预测分类 检测数据格式 p 阅读全文
posted @ 2017-11-11 18:46 Stephenatalie 阅读(382) 评论(0) 推荐(0) 编辑

2017年11月8日

摘要: 阅读全文
posted @ 2017-11-08 19:30 Stephenatalie 阅读(171) 评论(0) 推荐(0) 编辑

2017年11月5日

摘要: 2017-11-05 18:52:42 [scrapy.core.engine] INFO: Closing spider (finished)2017-11-05 18:52:42 [scrapy.statscollectors] INFO: Dumping Scrapy stats:{'down 阅读全文
posted @ 2017-11-05 19:15 Stephenatalie 阅读(3321) 评论(0) 推荐(0) 编辑

2017年11月4日

摘要: 应课程需要写了几天爬虫,一开始使用requests+bs4的技术路线,但是速度不是很理想而且不能暂停,通过查阅资料,发现scrapy正是我需要的 做一下简短的记录: 首先应该毫不犹豫的scrapy startproject gnspider;scrapy genspider gnspider htt 阅读全文
posted @ 2017-11-04 09:35 Stephenatalie 阅读(767) 评论(0) 推荐(0) 编辑