10 2021 档案
摘要:使用a标签下载: <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title></title> </head> <body> <a href="321.png" download="test.png">点击下载</a> </body> </
阅读全文
摘要:MySQL版本大于5.0时,有个默认数据库information_schema,里面存放着所有数据库的信息(比如表名、 列名、对应权限等) 列名数据类型描述 TABLE_CATALOG nvarchar(128) 表限定符。 TABLE_SCHEMA nvarchar(128) 表所有者。 TABL
阅读全文
摘要:常用指令: flushdb清空当前库 FLUSHALL清空全部数据库set key value,move key,keys *查看所有key,type key查看key的类型 APPEND key 在key后追加STRLEN key key的长度Hash key-MAPhset key 字段 val
阅读全文
摘要:Student文档如下: { “name”: “zhangsan”, “score”: { “English”: 69, “Math”: 86, “Computer”: 77 } } { “name”: “lisi”, “score”: { “English”: 55, “Math”: 100, “
阅读全文
摘要:Student键值对如下: zhangsan:{ English: 69 Math: 86 Computer: 77 } lisi:{ English: 55 Math: 100 Computer: 88 } 1. 根据上面给出的键值对,完成如下操作: (1)用Redis的哈希结构设计出学生表Stu
阅读全文
摘要:学生表Student name score English Math Computer zhangsan 69 86 77 lisi 55 100 88 根据上面给出的学生表Student的信息,执行如下操作: (1) 用Hbase Shell命令创建学生表Student; (2) 用scan命令浏
阅读全文
摘要:Name English Math Computer zhangsan 69 86 77 lisi 55 100 88 根据上面给出的Student表,在MySQL数据库中完成如下操作: (1) 在MySQL中创建Student表,并录入数据; CREATE TABLE `student` ( `i
阅读全文
摘要:将商家的特征值提取出来,转成CSV文件 #问题企业决策树 def problem(): # 1.获取数据 data_titanic = pd.read_csv("key_data_fp.csv") # 2.获取目标值与特征值 x = data_titanic[[ "xf_count", "gf_co
阅读全文
摘要:案例:泰坦尼克号乘客生存预测 泰坦尼克号数据 在泰坦尼克号和titanic2数据帧描述泰坦尼克号上的个别乘客的生存状态。这里使用的数据集是由各种研究人员开始的。其中包括许多研究人员创建的旅客名单,由Michael A. Findlay编辑。我们提取的数据集中的特征是票的类别,存活,乘坐班,年龄,登陆
阅读全文
摘要:决策树API class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None) 决策树分类器 criterion:默认是’gini’系数,也可以选择信息增益的熵’entropy’
阅读全文
摘要:#中文分词 def cut_word(text): text=" ".join(list(jieba.cut(text))) return text #中文文本的特征提取 def count_chinese_dome(): data=["10艘中俄军舰穿过津轻海峡,这一举措合乎国际法,无可指摘,却引
阅读全文
摘要:K-近邻算法API sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto') n_neighbors:int,可选(默认= 5),k_neighbors查询默认使用的邻居数 algorithm:{‘auto’,‘ba
阅读全文
摘要:方法 Filter(过滤式):主要探究特征本身特点、特征与特征和目标值之间关联 方差选择法:低方差特征过滤 相关系数 Embedded (嵌入式):算法自动选择特征(特征与目标值之间的关联) 决策树:信息熵、信息增益 正则化:L1、L2 深度学习:卷积等 4.1 低方差特征过滤 删除低方差的一些特征
阅读全文
摘要:#字典特征提取 def dict_dome(): data=[{"city":"北京","temperature":100},{"city":"上海","temperature":100},{"city":"深圳","temperature":100}] #1.实例化一个转换类器 transfer=
阅读全文
摘要:机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 划分比例: 训练集:70% 80% 75% 测试集:30% 20% 30% 数据集划分api sklearn.model_selection.train_test_split(ar
阅读全文
摘要:使用Scikit-learn 安装 pip3 install Scikit-learn==0.19.1 安装好之后可以通过以下命令查看是否安装成功 import sklearn 注:安装scikit-learn需要Numpy, Scipy等 1 scikit-learn数据集API介绍 sklear
阅读全文
摘要:1.转换为csv文件 2.导入hive 创建表 create table clear_data (ID String, QA04 String, QA05 String,QA07 String,QA15 String, QA19 String,industry String,QB03 String,
阅读全文
摘要:如上图这张图将会随日期滚动动态展示不同日期的销售与销量情况。 echarts代码: var chartDom = document.getElementById('main'); var myChart = echarts.init(chartDom); var option_hive; var d
阅读全文
摘要:1.利用echarts实现可视化,首先是绘制部分 //bar1 var bar1_myChart = echarts.init(document.querySelector(".bar .chart")); var bar1_data=[["河北"],[300]] var bar1_option =
阅读全文
摘要:数据分析处理: (1)统计每天各个机场的销售数量和销售金额。 要求的输出字段 day_id,sale_nbr,,cnt,round 日期编号,卖出方代码,数量,金额 (2)统计每天各个代理商的销售数量和销售金额。 要求的输出字段 day_id,sale_nbr,,cnt,round 日期编号,卖出方
阅读全文
摘要:1、数据导入: 要求将样表文件中的(sales_sample_20170310)数据导入HIVE数据仓库中。 1.在hive中创建表 将数据到如到hive中 传输完成 1.在hive中创建表 将数据到如到hive中 传输完成
阅读全文
摘要:Sqoop: 查询导入 bin/sqoop import --connect jdbc:mysql://hadoop102:3306/company --username root --password 123456 --target-dir /user/company --delete-targe
阅读全文