2016年5月9日

第四五周(3.28-4.10)进度及下周计划(4.10组会总结)

摘要: 进度: 我们完成了第一部分内容,即数据爬取和自然语言初步处理 下周计划: 完善情感词库,进一步情感分析 开始写工程的WEB界面 爬取的数据都来自东方财富网的股吧,包括标题,内容,作者,时间,以及评论等等,爬取的数目条数有几百万条,部分数据展示如下: 部分函数如下: 将爬取的数据存入mongodb中再 阅读全文

posted @ 2016-05-09 00:56 天生一队 阅读(148) 评论(0) 推荐(0) 编辑

2016年4月11日

第三周(3.21-3.27)进度及下周计划(3.27组会总结)

摘要: 进度: 我们完成了部分数据的爬取 同时情感分析和自然语言处理也展开了工作 下周计划: 完成全部数据的爬取 推进情感分析的工作,可以得到一定的结果 本周的爬取的数据都来自东方财富网中的股吧,我们希望通过爬取股吧内所有帖子,包括链接,题目,主题内容,发帖时间和评论等内容。使用Python递归地爬取股吧m 阅读全文

posted @ 2016-04-11 15:49 天生一队 阅读(137) 评论(2) 推荐(0) 编辑

2016年3月27日

第二周(3.14-3.20)进度及下周计划(3.21组会总结)

摘要: 现阶段成员分工与进度: 1.分工完成需求分析设计文档; 2.数据获取小组对中华英才网等网站的股吧进行数据爬取工作。 下周计划: 1.数据获取小组继续对中华英才网等网站的股吧进行数据爬取工作; 2.数据挖掘小组熟悉分词工具,准备对爬取的数据进行预处理。 阅读全文

posted @ 2016-03-27 19:41 天生一队 阅读(326) 评论(1) 推荐(0) 编辑

2016年3月22日

需求分析文档(3月22日)

摘要: 需求分析文档 1.背景 股票预测一直是一个热点问题。但是各种预测错综复杂,且都没有一个较为完善的结果。概括起来影响股票市场价格及其波动的因素,主要分为两大类:一是基本因素;另一种是技术因素。 所谓基本因素,是指来自股票的市场以外的经济与政治因素以及其他因素,其波动和变化往往会对股票的市场价格趋势产生 阅读全文

posted @ 2016-03-22 14:39 天生一队 阅读(530) 评论(1) 推荐(0) 编辑

项目介绍&人员介绍

摘要: 项目介绍 项目名称:股票舆情推荐系统 项目简介:主要通过对互联网股票舆情进行实时大数据挖掘分析,帮助客户对股票涨跌进行预测。 项目实现: 1.数据抽取 从股吧、新闻网站等地实时爬取数据 2.数据挖掘 对存储在数据库中的数据进行情感分析等文本处理 3.前端 实现可视化界面 项目确定历程: 项目功能点: 阅读全文

posted @ 2016-03-22 12:26 天生一队 阅读(829) 评论(1) 推荐(0) 编辑

导航