摘要:
K-近邻算法API sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto') n_neighbors:int,可选(默认= 5),k_neighbors查询默认使用的邻居数 algorithm:{‘auto’,‘ba 阅读全文
摘要:
方法 Filter(过滤式):主要探究特征本身特点、特征与特征和目标值之间关联 方差选择法:低方差特征过滤 相关系数 Embedded (嵌入式):算法自动选择特征(特征与目标值之间的关联) 决策树:信息熵、信息增益 正则化:L1、L2 深度学习:卷积等 4.1 低方差特征过滤 删除低方差的一些特征 阅读全文
摘要:
#字典特征提取 def dict_dome(): data=[{"city":"北京","temperature":100},{"city":"上海","temperature":100},{"city":"深圳","temperature":100}] #1.实例化一个转换类器 transfer= 阅读全文
摘要:
机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 划分比例: 训练集:70% 80% 75% 测试集:30% 20% 30% 数据集划分api sklearn.model_selection.train_test_split(ar 阅读全文
摘要:
使用Scikit-learn 安装 pip3 install Scikit-learn==0.19.1 安装好之后可以通过以下命令查看是否安装成功 import sklearn 注:安装scikit-learn需要Numpy, Scipy等 1 scikit-learn数据集API介绍 sklear 阅读全文
摘要:
1.转换为csv文件 2.导入hive 创建表 create table clear_data (ID String, QA04 String, QA05 String,QA07 String,QA15 String, QA19 String,industry String,QB03 String, 阅读全文
摘要:
如上图这张图将会随日期滚动动态展示不同日期的销售与销量情况。 echarts代码: var chartDom = document.getElementById('main'); var myChart = echarts.init(chartDom); var option_hive; var d 阅读全文
摘要:
1.利用echarts实现可视化,首先是绘制部分 //bar1 var bar1_myChart = echarts.init(document.querySelector(".bar .chart")); var bar1_data=[["河北"],[300]] var bar1_option = 阅读全文
摘要:
数据分析处理: (1)统计每天各个机场的销售数量和销售金额。 要求的输出字段 day_id,sale_nbr,,cnt,round 日期编号,卖出方代码,数量,金额 (2)统计每天各个代理商的销售数量和销售金额。 要求的输出字段 day_id,sale_nbr,,cnt,round 日期编号,卖出方 阅读全文
摘要:
1、数据导入: 要求将样表文件中的(sales_sample_20170310)数据导入HIVE数据仓库中。 1.在hive中创建表 将数据到如到hive中 传输完成 1.在hive中创建表 将数据到如到hive中 传输完成 阅读全文