结合工程实践选题调研分析同类软件产品

  我的工程实践选题是文本情感分析,即意见挖掘。简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。例如现在互联网上每时每刻都在产生大量的评论,这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评等,基于情感分析,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于莫一事件或产品的看法。所以说文本情感分析的研究价值很大,因此文本情感分析也成为了NLP中很热门的研究领域。

  通过调研了解到百度AI开放平台上就有文本情感分析的功能演示,其大概的功能就是你输入一段评论能够得出评论的情感色彩是正向情感还是负向情感,以及相应情感色彩的情感倾向程度。效果大概如下:

   目前国内外在文本情感分析的应用上还没有得到大量的普及,但是其效果都大致一样,因为情感分析只是一种对文本进行分析处理的技术,本文主要在文本情感分析的不同应用领域上进行研究和对比。

  情感分析在互联网商品评论中的应用。这是随着电子商务蓬勃发展而兴起的一个研究领域,它具有非常广泛的应用前景与巨大的商业价值。针对商品评论的情感分析往往需要从更细的粒度来进行分析,而不是以文本为单位,因为对于商品使用者来说,往往是针对产品的某一些特征或主题进行评论,而不是整个产品。但是要将情感分析技术运用到具体的商业应用,还面临这较大的困难。例如现在越来越多的厂商为了提高商品的销量,往往会在商品评论中添加很多的虚假评论,通过“刷单”的方式吸引潜在的消费者,因此这严重减低了情感分析的准确率。

  情感分析在微博中的应用。由于微博的可移动性、内容的共享性、简洁性和实时性使得微博已经成为了大多数网民日常生活中不可缺少的交流互动的社交网络媒体,对微博进行情感分析可以了解到用户对某一事件或决策的看法。与对商品评论进行情感分析的方式不同,微博的情感分析更注重的是情感分类,即将文本内容所表达的情感倾向分为负向、中性和正向。微博的情感分析也面临着很多困难,由于中国人口众多,微博的用户数量也很庞大,用户每天发的微博内容可以构成一个庞大的语料库,但是由于中文分词的复杂性,需要将文本进行向量化,所以对语料库的标注是一个极其耗时耗力的事情,同样也存在很大错误率。

  情感分析在股票预测中的应用。对于金融这个领域,互联网已经成为投资者获取各种股市投资信息的主要渠道,于此同时,越来越多的投资者通过互联网来搜索相关金融信息,同时发表自己对于金融市场的观点,就企业投资意向、市场走势等问题进行交流,通过研究发现一个人的行为和情绪有很大联系,所以可以通过情感色彩来对股票进行预测。这类研究主要应用文本挖掘技术来识别在线评论的极性,或是通过机器学习的技术提取文本数据特征,再和相关的股市表现数据进行测试训练来进行预测。主要从大盘、板块、行业和个股四个层面来分析研究股评情感指数与股市表现之间的关系。该领域的难点有,相关股票金融信息的挖掘需要结合专业的金融背景知识来分析,在金融环境下有效识别评论情感倾向存在一定的难度。

  1. 文本情感分析主要的目标是能够更准确和快速的分析提取出文本的情感色彩和情感倾向,这样普通用户就不要花大量的时间人工浏览文本来进行评判了,可以很大程度上提高人们的工作效率
  2. 最有可能的是扩大用户的数量,因为应用文本情感分析可以提高人们的效率所以会有更多的人选择带有文本情感分析的产品
  3. 这些产品最有可能的是在线使用,例如百度AI开放平台的情感分析
  4. 这些软件的bug主要是由于自然语言处理的难点所在,即语言的复杂性。
  5. 文本情感分析是近几年NLP研究的重点领域,不同产品的竞争可能是应用的模型,我相信文本情感分析会越来越火,也相信它在10年,20年之后依然会存在,因为文本情感分析现在只是初步阶段,随着计算机计算能力的提升和语料库的完善,文本情感分析会越来越成熟,同时也会产生越来越好的模型。
posted @ 2019-10-07 19:29  浅安时光~  阅读(207)  评论(0编辑  收藏  举报