2021 年 4月 11 日随笔档案 - 陕西小楞娃

2021年4月11日

摘要：代码： package com.test import org.apache.spark.SparkConf import org.apache.spark.ml.classification.LogisticRegression import org.apache.spark.ml.linalg. 阅读全文

posted @ 2021-04-11 14:23 陕西小楞娃阅读(94) 评论(0) 推荐(0) 编辑

机器学习-微博精准营销

摘要：思路研究特征所有的微博变成词袋一条微博形成一条向量，数量代表出现的次数使用TF-IDF计算词的重要性选取主要的重要的词进行KMeans聚类筛选出的N个次就能很好的代表当前类的主旨思想，可以给与到网络营销部分代码 package com.test import scala.collect 阅读全文

posted @ 2021-04-11 12:51 陕西小楞娃阅读(78) 评论(0) 推荐(0) 编辑