摘要: 简介朋友问我能不能做一个下载他在豆瓣读书上的短评的工具,于是就做了这个“豆瓣用户读书短评下载工具”。 GitHub链接:https://github.com/xiaff/dbc-downloader。这个小工具使用Python3.4编写,其工作流程为:用户输入其豆瓣ID;抓取用户评论列表网页对网页进... 阅读全文
posted @ 2015-10-07 10:48 夏方方 阅读(1044) 评论(0) 推荐(0) 编辑
摘要: 本文认为不同性别的人偏好的电影类型会有所不同,因此进行了此实验。利用较为活跃的274位豆瓣用户最近观看的100部电影,对其类型进行统计,以得到的37种电影类型作为属性特征,以用户性别作为标签构建样本集。使用kNN算法构建豆瓣电影用户性别分类器,使用样本中的90%作为训练样本,10%作为测试样本,准确 阅读全文
posted @ 2015-10-07 10:44 夏方方 阅读(4906) 评论(24) 推荐(1) 编辑
摘要: 前言由于之后要做一个实验,需要用到大量豆瓣用户的电影数据,因此想到了从豆瓣电影的“看过这部电影 的豆瓣成员”页面上来获取较为活跃的豆瓣电影用户。链接分析这是看过"模仿游戏"的豆瓣成员的网页链接:http://movie.douban.com/subject/10463953/collections。... 阅读全文
posted @ 2015-10-07 10:27 夏方方 阅读(2487) 评论(5) 推荐(0) 编辑