摘要:
/** * Created by lkl on 2017/6/27. */ import java.sql.{DriverManager, ResultSet} import org.apache.spark.SparkContext import org.apache.spark.SparkConf import java.math.BigDecimal object layer { ... 阅读全文
摘要:
数据源为从新浪,腾讯,搜狐三个财经网站爬取而来,C++先进行过分词; 这边对分词后的词进行处理,代码如下: 阅读全文
摘要:
系统的目标有两个: 一是行业分类; 二是每个行业的情感值计算; ①因为是基金推荐项目,分析了国民经济分类和同花顺,最终采用同花顺的66个行业分类为标准。 ②行业分类依据词,词库采用从百度词库、搜狗细胞词库手工分析下载而来,下载而来的是未解析的格式, 我这里以‘深蓝词库转换’这个工具进行转换成对应的6 阅读全文