最近在写毕业论文,是做个文本分类相关的题目。想抓取网易新闻里那些新闻内容作为分析的数据,于是就又照着scrapy的文档照做了一遍。。。 感觉主要就只是两个文件items.py和spiders文件夹下的爬取规则的文件,我这里爬取技术类文档的直接叫tech.py了 scrapy的入门教程已经写的很详细了 Read More
今天遇到一个问题,纠结一段时间后终于想到一个方法,挺开心的,就记录下。问题简化之后是这样的:对于python中类似这样的一个列表[{'A':2,'B':3,'C':4},{'A':2,'B':4,'C':5},{'A':2,'B':3,'C':5},{'A':2,'B':3,'C':6}]其中列表的... Read More
看书的时候看到一个问题,觉得挺有意思的,便想记一下。问题是这样的,对于一个序列A1,A2,...AN,求使得ΣAk最大的值,其中 1≤ i ≤ k ≤ j ≤N。例如对于序列(-2,11,-4,13,-5,-2),其答案为20(从A2到A4)。这本来是个很简单的问题,一种最直观的想法便是用循环,遍历... Read More