枫叶漂漂

2016年3月27日

最近在写毕业论文，是做个文本分类相关的题目。想抓取网易新闻里那些新闻内容作为分析的数据，于是就又照着scrapy的文档照做了一遍。。。感觉主要就只是两个文件items.py和spiders文件夹下的爬取规则的文件，我这里爬取技术类文档的直接叫tech.py了 scrapy的入门教程已经写的很详细了 Read More

posted @ 2016-03-27 23:56 枫叶漂漂 Views(3220) Comments(0) Diggs(0)

2015年10月27日

读书备忘录--C++标准库

记录下C++ 标准库容器里常弄混的一些知识点。 Read More

posted @ 2015-10-27 10:24 枫叶漂漂 Views(170) Comments(0) Diggs(0)

2015年9月6日

python含嵌套的列表去重问题

今天遇到一个问题，纠结一段时间后终于想到一个方法，挺开心的，就记录下。问题简化之后是这样的：对于python中类似这样的一个列表[{'A':2,'B':3,'C':4},{'A':2,'B':4,'C':5},{'A':2,'B':3,'C':5},{'A':2,'B':3,'C':6}]其中列表的... Read More

posted @ 2015-09-06 19:26 枫叶漂漂 Views(2503) Comments(0) Diggs(0)

2015年9月5日

最大子序列和问题

看书的时候看到一个问题，觉得挺有意思的，便想记一下。问题是这样的，对于一个序列A1,A2,...AN,求使得ΣAk最大的值，其中 1≤ i ≤ k ≤ j ≤N。例如对于序列（-2,11,-4,13,-5,-2)，其答案为20（从A2到A4)。这本来是个很简单的问题，一种最直观的想法便是用循环，遍历... Read More

posted @ 2015-09-05 14:42 枫叶漂漂 Views(248) Comments(0) Diggs(0)

2015年6月9日

R_timeseries

#timeseries_R#1.读取数据births <- scan("http://robjhyndman.com/tsdldata/data/nybirths.dat")birthstimeseries <- ts(births, frequency=12, start=c(1946,1))pl... Read More

posted @ 2015-06-09 20:27 枫叶漂漂 Views(517) Comments(0) Diggs(0)

公告