最近在写毕业论文,是做个文本分类相关的题目。想抓取网易新闻里那些新闻内容作为分析的数据,于是就又照着scrapy的文档照做了一遍。。。 感觉主要就只是两个文件items.py和spiders文件夹下的爬取规则的文件,我这里爬取技术类文档的直接叫tech.py了 scrapy的入门教程已经写的很详细了 Read More
posted @ 2016-03-27 23:56 枫叶漂漂 Views(3200) Comments(0) Diggs(0)
记录下C++ 标准库容器里常弄混的一些知识点。 Read More
posted @ 2015-10-27 10:24 枫叶漂漂 Views(166) Comments(0) Diggs(0)
今天遇到一个问题,纠结一段时间后终于想到一个方法,挺开心的,就记录下。问题简化之后是这样的:对于python中类似这样的一个列表[{'A':2,'B':3,'C':4},{'A':2,'B':4,'C':5},{'A':2,'B':3,'C':5},{'A':2,'B':3,'C':6}]其中列表的... Read More
posted @ 2015-09-06 19:26 枫叶漂漂 Views(2496) Comments(0) Diggs(0)
看书的时候看到一个问题,觉得挺有意思的,便想记一下。问题是这样的,对于一个序列A1,A2,...AN,求使得ΣAk最大的值,其中 1≤ i ≤ k ≤ j ≤N。例如对于序列(-2,11,-4,13,-5,-2),其答案为20(从A2到A4)。这本来是个很简单的问题,一种最直观的想法便是用循环,遍历... Read More
posted @ 2015-09-05 14:42 枫叶漂漂 Views(243) Comments(0) Diggs(0)
#timeseries_R#1.读取数据births <- scan("http://robjhyndman.com/tsdldata/data/nybirths.dat")birthstimeseries <- ts(births, frequency=12, start=c(1946,1))pl... Read More
posted @ 2015-06-09 20:27 枫叶漂漂 Views(509) Comments(0) Diggs(0)