07 2018 档案

摘要:一.概述 二.范式 第一范式(1NF):在关系模式R中,当且仅当所有域只包含原子值,即每个分量都是不可再分的数据项。 第二范式(2NF):当且仅当是第一范式(1NF),且每个非主属性完全依赖主键(即不存在部分依赖)。 第三范式(3NF):当且仅当是第二范式(2NF),且不存在非主属性对候选码的传递依 阅读全文
posted @ 2018-07-29 22:10 云山之巅 阅读(761) 评论(0) 推荐(0) 编辑
摘要:Task优化: 1.慢任务的性能优化:可以考虑减少每个Partition处理的数据量,同时建议开启spark.speculation(慢任务推导,当检测的慢任务时,会同步开启相同的新任务,谁先完成就认定该任务完成)。 2.尽量减少Shuffle,例如我们要尽量减少groupByKey的操作,因为gr 阅读全文
posted @ 2018-07-28 21:50 云山之巅 阅读(241) 评论(0) 推荐(0) 编辑
摘要:6.下列攻击行为中,属于典型被动攻击的是(10)。 A.拒绝服务攻击 B.会话拦截 C.系统干涉 D.修改数据命令 答案:C 解析: 被动攻击主要是收集信息而不是进行访问,数据的合法用户对这种活动一点也不会觉察到。被动攻击包括嗅探、信息收集等攻击方法。攻击方不知道被攻击方什么时候对话。 7.某软件项 阅读全文
posted @ 2018-07-27 14:54 云山之巅 阅读(2041) 评论(0) 推荐(0) 编辑
摘要:1.选择"记录数",拖拽两个记录数放入列中,求总和,选择饼图: 2.选择"大小",调整两个饼图的大小: 3.点击第二个总和(行上的),选择“双轴”: 4.点击坐标轴,选择“同步轴”: 5.修改小饼图的颜色,设置为白色: 6.修改"记录数"运算为求平均值: 7.选择"整个视图",点击"编辑轴",调整坐 阅读全文
posted @ 2018-07-26 16:36 云山之巅 阅读(1303) 评论(0) 推荐(1) 编辑
摘要:1.以下关于防火墙功能特性的叙述中,不正确的是(1)。 A.控制进出网络的数据包和数据流向 B.提供流量信息的日志和审计 C.隐藏内部IP以及网络结构细节 D.提供漏洞扫描功能 答案:D 解析:防火墙是被动防御,无法提供系统漏洞扫描。 2.在程序执行过程中,Cache与主存的地址映射是由(2)完成的 阅读全文
posted @ 2018-07-24 16:26 云山之巅 阅读(746) 评论(0) 推荐(0) 编辑
摘要:一.图 二.树 三.排序算法 1.稳定排序算法&不稳定排序算法 2.插入排序 3.选择排序 4.交换排序 5.归并排序 6.基数排序 7.各排序算法的特点 四.其它算法 1.递推法 2.回溯法 3.贪婪法 4.分治法 5.动态规划法 五.基础试题 1. 2. 3. 4. 5. 6. 7. 8. 9. 阅读全文
posted @ 2018-07-21 16:57 云山之巅 阅读(485) 评论(0) 推荐(0) 编辑
摘要:16.某集团公司下属有多个超市,每个超市的所有销售数据最终要存入公司的数据仓库中。假设该公司高管需要从时间,地区和商品种类三个维度来分析某家店商品的销售数据,那么最适合采用(56)来完成。 选项: A.Data Extraction B.OLAP C.OLTP D.ETL 答案:B 解析: Data 阅读全文
posted @ 2018-07-18 15:55 云山之巅 阅读(1670) 评论(0) 推荐(0) 编辑
摘要:11.能力成熟模型集成(CMMI)是若干过程模型的综合和改进。连续式模型和阶段式模型是CMMI提供的两种表示方法。连续式模型包括6个过程域能力等级(Capability Level,CL)其中(30)的共性目标是过程将可标识的输入工作产品转换成可标识的输出工作产品,以实现支持过程域的特定目标。 选项 阅读全文
posted @ 2018-07-17 18:04 云山之巅 阅读(1541) 评论(0) 推荐(0) 编辑
摘要:6.在安全通信中,S将所发送的信息使用(8)进行数字签名,T收到该消息后可利用(9)验证该消息的真实性。 选项: (8)A. S的公钥 B.S的私钥 C.T的公钥 D.T的私钥 (9)A. S的公钥 B.S的私钥 C.T的公钥 D.T的私钥 答案:B,A 解析: 数字签名技术是将摘要信息用发送者的私 阅读全文
posted @ 2018-07-17 17:34 云山之巅 阅读(970) 评论(0) 推荐(0) 编辑
摘要:代码: 结果: 阅读全文
posted @ 2018-07-17 14:35 云山之巅 阅读(645) 评论(0) 推荐(0) 编辑
摘要:代码实现: 结果: 总结:各回归算法在相同的测试数据中表现差距很多,且算法内的配置参数调整对自身算法的效果影响也是巨大的, 因此合理挑选合适的算法和配置合适的配置参数是使用算法的关键! 阅读全文
posted @ 2018-07-16 15:06 云山之巅 阅读(3222) 评论(0) 推荐(0) 编辑
摘要:代码: 结果: 总结: K-NN的优点之一就是模型很容易理解,通常不需要过多调节就可以得到不错的性能。 在考虑使用更高级的技术之前,尝试此算法是一种很好的基准方法。 构建模型的速度通常很快,但如果训练集很大(特征数很多或样本基数很大),预测速度可能会比较慢。 因此,使用此算法之前进行数据预处理是很重 阅读全文
posted @ 2018-07-13 11:23 云山之巅 阅读(788) 评论(0) 推荐(0) 编辑
摘要:代码: 结果: 阅读全文
posted @ 2018-07-13 11:12 云山之巅 阅读(410) 评论(0) 推荐(0) 编辑
摘要:代码: 结果: 阅读全文
posted @ 2018-07-13 11:09 云山之巅 阅读(1012) 评论(0) 推荐(0) 编辑
摘要:代码: 结果: 阅读全文
posted @ 2018-07-13 11:07 云山之巅 阅读(244) 评论(0) 推荐(0) 编辑
摘要:代码: 结果: 总结:在仅考虑单一近邻时,训练集上的预测结果十分完美(接近100%)。但随着邻居个数的增多,模型变得更简单(泛化能力越好),训练集精度也随之下降。为求得较好的预测精度和泛化能力,最佳性能在neighbors为6左右! 阅读全文
posted @ 2018-07-12 10:32 云山之巅 阅读(747) 评论(0) 推荐(0) 编辑
摘要:1 # -*- coding: utf-8 -*- 2 """ 3 Created on Thu Jun 28 17:16:19 2018 4 5 @author: zhen 6 """ 7 from sklearn.model_selection import train_test_split 8 阅读全文
posted @ 2018-07-12 10:17 云山之巅 阅读(761) 评论(0) 推荐(0) 编辑
摘要:1.浮点数的表示分为阶和尾数 两部分。两个浮点数相加时,需要先对阶,即(1)(n为阶差的绝对值) 答案: 1 D将小阶向大阶对齐,同时将尾数右移n位 解析: 对阶是指将两个进行运算的浮点数阶码对齐的操作。对阶的目的是为使两个浮点数的尾数能够进行加减运算。首先求出两浮点数阶码的差,即n,将小阶码加上n 阅读全文
posted @ 2018-07-11 16:12 云山之巅 阅读(1502) 评论(0) 推荐(0) 编辑
摘要:实现:# -*- coding: UTF-8 -*- import numpy as npfrom sklearn.linear_model import SGDRegressor__author__ = 'zhen'X = 2 * np.random.rand(100, 1)y = 4 + 3 * X + np.random.randn(100, 1)# 梯度下降回归sgd_reg = SGDR... 阅读全文
posted @ 2018-07-08 17:33 云山之巅 阅读(4106) 评论(0) 推荐(0) 编辑
摘要:实现:# -*- coding: UTF-8 -*-import numpy as npfrom sklearn.linear_model import Ridge__author__ = 'zhen'X = 2 * np.random.rand(100, 1)y = 4 + 3 * X + np.random.randn(100, 1)# 岭回归ridge_reg = Ridge(alpha=1... 阅读全文
posted @ 2018-07-08 17:19 云山之巅 阅读(1261) 评论(0) 推荐(0) 编辑
摘要:实现:# -*- coding: UTF-8 -*-""" 练习使用随机梯度下降算法"""import numpy as npimport math__author__ = 'zhen'# 生成测试数据x = 2 * np.random.rand(100, 1) # 随机生成100*1的二维数组,值分别在0~2之间y = 4 + 3 * x + np.random.randn(100, 1... 阅读全文
posted @ 2018-07-08 17:10 云山之巅 阅读(2433) 评论(0) 推荐(0) 编辑
摘要:# -*- coding: utf-8 -*-"""Created on Wed Jul 4 18:40:55 2018 @author: zhen""" import pandas as pdimport numpy as np# 创建空的df,保存测试数据test_df = pd.DataFra 阅读全文
posted @ 2018-07-05 10:17 云山之巅 阅读(6455) 评论(0) 推荐(1) 编辑
摘要:# -*- coding: UTF-8 -*-import numpy as npimport math# 定义基础变量learning_rate = 0.1n_iterations = 10000m = 100x = 2 * np.random.rand(m, 1) # 生成一组服从0~1均匀分布的随机样本,此处表示生成100行一列的二维数组,下同y = 4 + 3 * x + np.rand... 阅读全文
posted @ 2018-07-02 19:52 云山之巅 阅读(2165) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示