摘要: 目前我们的进度是语义分析和情感分析工作已经大体完工,微博抓取工作使用JAVA语言还有一点问题没有实现。 阅读全文
posted @ 2016-09-13 09:01 hzsy 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 我们抓取微博数据原来使用的是Python语言编写的,由于其他的技术是用JAVA语言编写的,所以将抓取功能换为JAVA语言编写。这是我们遇到的一大难题。网上没有较好的解决方法! 阅读全文
posted @ 2016-09-11 08:28 hzsy 阅读(82) 评论(0) 推荐(0) 编辑
摘要: SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直 阅读全文
posted @ 2016-09-10 08:23 hzsy 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 系统中使用的情感分析技术我们采用的是基于词典的情感分析,情感分析(SA)又称为倾向性分析和意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,其中情感分析还可以细分为情感极性(倾向)分析,情感程度分析,主客观分析等。情感极性分析的目的是对文本进行褒义、贬义、中性的判断。在大多应 阅读全文
posted @ 2016-09-08 08:30 hzsy 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 我们系统的欢迎页: 我们系统的主页: 我们调用的新浪微博的API来抓取微博信息,新浪微博中有很多API是需要登陆验证的,新浪使用了 Oauth2.0,大概流程是 你首先提交你的应用信息,这时会弹出授权页面,在授权后,会跳转到你所填写的授权地址。在URL中有一串code(浏览器地址栏中),将code输 阅读全文
posted @ 2016-09-07 19:26 hzsy 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 我们的分词技术采用的是“语言云”的平台,语言技术平台(Language Technology Platform,LTP)是哈工大社会计算与信息检索研究中心历时十年研制的一整套开放中文自然语言处理系统。 LTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富、高效、高精度的中 阅读全文
posted @ 2016-09-07 19:08 hzsy 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 了解了“语言云”的相关知识,“语言云” 以哈工大社会计算与信息检索研究中心研发的“语言技术平台(LTP)”为基础,为用户提供高效精准的中文自然语言处理云服务。 使用 “语言云” 非常简单,只需要根据 API 参数构造 HTTP 请求即可在线获得分析结果,而无需下载 SDK 、无需购买高性能的机器,同 阅读全文
posted @ 2016-09-06 07:16 hzsy 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 学习情感分析相关知识。情感分析(SA)又称为倾向性分析和意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,其中情感分析还可以细分为情感极性(倾向)分析,情感程度分析,主客观分析等。情感极性分析的目的是对文本进行褒义、贬义、中性的判断。在大多应用场景下,只分为两类。例如对于“喜 阅读全文
posted @ 2016-09-05 08:32 hzsy 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 今天进行了第二天的培训,老师主要讲解了目前广泛使用的开源框架,包括前台和后台的。分别举了一个SSM(Spring+SpringMVC+MyBatis)的例子和一个Hibernate框架的例子,区分了两个框架的共同点和不同点。还指导了一些从无到有自学各种不同技术的方法和途径,包括浏览相关技术的博客,看 阅读全文
posted @ 2016-09-04 06:42 hzsy 阅读(132) 评论(0) 推荐(0) 编辑
摘要: 今天,我们进行了有关大数据的培训,知道了什么是大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。大数据的5V特点:Volume(大量)、Velocity(高速)、Varie 阅读全文
posted @ 2016-09-02 20:26 hzsy 阅读(153) 评论(0) 推荐(0) 编辑