摘要:
这次去杭州参加阿里巴巴的离线大数据处理暑期课,得到一个思路。之前一直纠结于没有数据要怎么训练我的旅行个性化推荐。毕设木有头绪啊,做不粗来要人命呀!现在觉得可以在网上爬一些数据下来,看看能不能分析出各个景点之间的关系。现在 开贴记录自己的工作。2013.7.24使用urllib。(3.0以后urllib2就整合到urllib中了,见【这里】)import urllib.requestc = urllib.request.urlopen('http://www.baidu.com')contents = c.read()print(contents[0:50])代码参考自《集体智慧 阅读全文