上一页 1 2 3 4 5 6 7 8 9 10 ··· 29 下一页
摘要: /** * Created by lkl on 2017/12/6. */ import org.apache.spark.mllib.evaluation.BinaryClassificationMetrics import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.mllib.regression.La... 阅读全文
posted @ 2017-12-08 16:46 残阳飞雪 阅读(286) 评论(0) 推荐(0) 编辑
摘要: Contents 1. CART算法的认识 2. CART算法的原理 3. CART算法的实现 1. CART算法的认识 Classification And Regression Tree,即分类回归树算法,简称CART算法,它是决策树的一种实现,通 常决策树主要有三种实现,分别是ID3算法,CA 阅读全文
posted @ 2017-11-09 10:07 残阳飞雪 阅读(2074) 评论(0) 推荐(0) 编辑
摘要: 本文结构: CART算法有两步 回归树的生成 分类树的生成 剪枝 CART - Classification and Regression Trees 分类与回归树,是二叉树,可以用于分类,也可以用于回归问题,最先由 Breiman 等提出。 分类树的输出是样本的类别, 回归树的输出是一个实数。 C 阅读全文
posted @ 2017-11-08 10:40 残阳飞雪 阅读(3887) 评论(0) 推荐(0) 编辑
摘要: /** * Created by lkl on 2017/10/9. */ import org.apache.spark.sql.hive.HiveContext import org.apache.spark.SparkConf import scala.collection.mutable.ArrayBuffer import org.apache.spark.SparkConte... 阅读全文
posted @ 2017-10-31 17:10 残阳飞雪 阅读(637) 评论(0) 推荐(0) 编辑
摘要: CREATE TABLE `result` (`id` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,`thetime` CHAR(100) , `category` CHAR(100) , `weight` decimal(24,4), PRIMARY KEY 阅读全文
posted @ 2017-08-01 18:04 残阳飞雪 阅读(222) 评论(0) 推荐(0) 编辑
摘要: CREATE TABLE `category` ( `id` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT, `editdate` char(20) NOT NULL DEFAULT "20170622", `number` CHAR(100) NOT NULL DEFAULT "spell", `category` CHAR(100) NOT NULL... 阅读全文
posted @ 2017-08-01 16:48 残阳飞雪 阅读(302) 评论(0) 推荐(0) 编辑
摘要: CREATE table layer(id INT(12) UNSIGNED NOT NULL AUTO_INCREMENT, words VARCHAR(500), value decimal(10,7), PRIMARY KEY(id) ) DEFAULT CHARSET=utf8; ALTER TABLE `layer` ADD INDEX(`words`) /** *... 阅读全文
posted @ 2017-08-01 16:44 残阳飞雪 阅读(383) 评论(0) 推荐(0) 编辑
摘要: CREATE TABLE `middle` ( `id` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT, `innserSessionid` VARCHAR(250), `times` VARCHAR(250), `number` VARCHAR(250), `category` VARCHAR(250), `svalue` DECIMAL(32,7), `w... 阅读全文
posted @ 2017-08-01 16:43 残阳飞雪 阅读(287) 评论(0) 推荐(0) 编辑
摘要: CREATE TABLE titlesplit(id INT(12) UNSIGNED NOT NULL AUTO_INCREMENT, innserSessionid VARCHAR(50), times VARCHAR(50), channelType VARCHAR(50), sourcetitle VARCHAR(500), title VARCHAR(500), words VARC... 阅读全文
posted @ 2017-08-01 16:41 残阳飞雪 阅读(196) 评论(0) 推荐(0) 编辑
摘要: import breeze.linalg import org.apache.spark.ml.Pipeline import org.apache.spark.ml.classification.MultilayerPerceptronClassifier import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluat... 阅读全文
posted @ 2017-07-28 11:06 残阳飞雪 阅读(780) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 29 下一页