2018 年 7月随笔档案 - 云山之巅

软件设计师【数据库设计及相关试题】

摘要：一.概述二.范式第一范式（1NF）：在关系模式R中，当且仅当所有域只包含原子值，即每个分量都是不可再分的数据项。第二范式（2NF）：当且仅当是第一范式（1NF），且每个非主属性完全依赖主键（即不存在部分依赖）。第三范式（3NF）：当且仅当是第二范式（2NF），且不存在非主属性对候选码的传递依阅读全文

posted @ 2018-07-29 22:10 云山之巅阅读(761) 评论(0) 推荐(0) 编辑

Spark性能优化（基于Spark 1.x）

摘要：Task优化： 1.慢任务的性能优化：可以考虑减少每个Partition处理的数据量，同时建议开启spark.speculation（慢任务推导，当检测的慢任务时，会同步开启相同的新任务，谁先完成就认定该任务完成）。 2.尽量减少Shuffle，例如我们要尽量减少groupByKey的操作，因为gr 阅读全文

posted @ 2018-07-28 21:50 云山之巅阅读(241) 评论(0) 推荐(0) 编辑

软件设计师考试17年下半年上午考试真题及解析(二)

摘要：6.下列攻击行为中，属于典型被动攻击的是（10）。 A.拒绝服务攻击 B.会话拦截 C.系统干涉 D.修改数据命令答案：C 解析：被动攻击主要是收集信息而不是进行访问，数据的合法用户对这种活动一点也不会觉察到。被动攻击包括嗅探、信息收集等攻击方法。攻击方不知道被攻击方什么时候对话。 7.某软件项阅读全文

posted @ 2018-07-27 14:54 云山之巅阅读(2041) 评论(0) 推荐(0) 编辑

Tableau环图可视化

摘要：1.选择"记录数"，拖拽两个记录数放入列中，求总和，选择饼图： 2.选择"大小"，调整两个饼图的大小： 3.点击第二个总和（行上的），选择“双轴”： 4.点击坐标轴，选择“同步轴”： 5.修改小饼图的颜色，设置为白色： 6.修改"记录数"运算为求平均值： 7.选择"整个视图"，点击"编辑轴"，调整坐阅读全文

posted @ 2018-07-26 16:36 云山之巅阅读(1303) 评论(0) 推荐(1) 编辑

软件设计师考试17年下半年上午考试真题及解析(一)

摘要：1.以下关于防火墙功能特性的叙述中，不正确的是（1）。 A.控制进出网络的数据包和数据流向 B.提供流量信息的日志和审计 C.隐藏内部IP以及网络结构细节 D.提供漏洞扫描功能答案：D 解析：防火墙是被动防御，无法提供系统漏洞扫描。 2.在程序执行过程中，Cache与主存的地址映射是由（2）完成的阅读全文

posted @ 2018-07-24 16:26 云山之巅阅读(746) 评论(0) 推荐(0) 编辑

软件设计师【数据结构与算法基础知识及相关试题】

摘要：一.图二.树三.排序算法 1.稳定排序算法&不稳定排序算法 2.插入排序 3.选择排序 4.交换排序 5.归并排序 6.基数排序 7.各排序算法的特点四.其它算法 1.递推法 2.回溯法 3.贪婪法 4.分治法 5.动态规划法五.基础试题 1. 2. 3. 4. 5. 6. 7. 8. 9. 阅读全文

posted @ 2018-07-21 16:57 云山之巅阅读(485) 评论(0) 推荐(0) 编辑

软件设计师考试18年上半年上午考试真题及解析(四)

摘要：16.某集团公司下属有多个超市，每个超市的所有销售数据最终要存入公司的数据仓库中。假设该公司高管需要从时间，地区和商品种类三个维度来分析某家店商品的销售数据，那么最适合采用（56）来完成。选项： A.Data Extraction B.OLAP C.OLTP D.ETL 答案：B 解析： Data 阅读全文

posted @ 2018-07-18 15:55 云山之巅阅读(1670) 评论(0) 推荐(0) 编辑

软件设计师考试18年上半年上午考试真题及解析(三)

摘要：11.能力成熟模型集成（CMMI）是若干过程模型的综合和改进。连续式模型和阶段式模型是CMMI提供的两种表示方法。连续式模型包括6个过程域能力等级（Capability Level，CL）其中（30）的共性目标是过程将可标识的输入工作产品转换成可标识的输出工作产品，以实现支持过程域的特定目标。选项阅读全文

posted @ 2018-07-17 18:04 云山之巅阅读(1541) 评论(0) 推荐(0) 编辑

软件设计师考试18年上半年上午考试真题及解析(二)

摘要：6.在安全通信中，S将所发送的信息使用（8）进行数字签名，T收到该消息后可利用（9）验证该消息的真实性。选项：（8）A. S的公钥 B.S的私钥 C.T的公钥 D.T的私钥（9）A. S的公钥 B.S的私钥 C.T的公钥 D.T的私钥答案：B,A 解析：数字签名技术是将摘要信息用发送者的私阅读全文

posted @ 2018-07-17 17:34 云山之巅阅读(970) 评论(0) 推荐(0) 编辑

逻辑回归&线性支持向量机

摘要：代码：结果：阅读全文

posted @ 2018-07-17 14:35 云山之巅阅读(645) 评论(0) 推荐(0) 编辑

回归算法比较【线性回归，Ridge回归，Lasso回归】

摘要：代码实现：结果：总结：各回归算法在相同的测试数据中表现差距很多，且算法内的配置参数调整对自身算法的效果影响也是巨大的，因此合理挑选合适的算法和配置合适的配置参数是使用算法的关键！阅读全文

posted @ 2018-07-16 15:06 云山之巅阅读(3222) 评论(0) 推荐(0) 编辑

K邻近回归算法

摘要：代码：结果：总结： K-NN的优点之一就是模型很容易理解，通常不需要过多调节就可以得到不错的性能。在考虑使用更高级的技术之前，尝试此算法是一种很好的基准方法。构建模型的速度通常很快，但如果训练集很大（特征数很多或样本基数很大），预测速度可能会比较慢。因此，使用此算法之前进行数据预处理是很重阅读全文

posted @ 2018-07-13 11:23 云山之巅阅读(788) 评论(0) 推荐(0) 编辑

matplotlib正弦和余弦图

摘要：代码：结果：阅读全文

posted @ 2018-07-13 11:12 云山之巅阅读(410) 评论(0) 推荐(0) 编辑

matplotlib箱线图与柱状图比较

摘要：代码：结果：阅读全文

posted @ 2018-07-13 11:09 云山之巅阅读(1012) 评论(0) 推荐(0) 编辑

matplotlib多plot可视化

摘要：代码：结果：阅读全文

posted @ 2018-07-13 11:07 云山之巅阅读(244) 评论(0) 推荐(0) 编辑

查看neighbors大小对K近邻分类算法预测准确度和泛化能力的影响

摘要：代码：结果：总结：在仅考虑单一近邻时，训练集上的预测结果十分完美（接近100%）。但随着邻居个数的增多，模型变得更简单（泛化能力越好），训练集精度也随之下降。为求得较好的预测精度和泛化能力，最佳性能在neighbors为6左右！阅读全文

posted @ 2018-07-12 10:32 云山之巅阅读(747) 评论(0) 推荐(0) 编辑

K邻近分类算法

摘要：1 # -*- coding: utf-8 -*- 2 """ 3 Created on Thu Jun 28 17:16:19 2018 4 5 @author: zhen 6 """ 7 from sklearn.model_selection import train_test_split 8 阅读全文

posted @ 2018-07-12 10:17 云山之巅阅读(761) 评论(0) 推荐(0) 编辑

软件设计师考试18年上半年上午考试真题及解析(一)

摘要：1.浮点数的表示分为阶和尾数两部分。两个浮点数相加时，需要先对阶，即（1）（n为阶差的绝对值）答案： 1 D将小阶向大阶对齐，同时将尾数右移n位解析：对阶是指将两个进行运算的浮点数阶码对齐的操作。对阶的目的是为使两个浮点数的尾数能够进行加减运算。首先求出两浮点数阶码的差，即n，将小阶码加上n 阅读全文

posted @ 2018-07-11 16:12 云山之巅阅读(1502) 评论(0) 推荐(0) 编辑

Python之SGDRegressor

摘要：实现：# -*- coding: UTF-8 -*- import numpy as npfrom sklearn.linear_model import SGDRegressor__author__ = 'zhen'X = 2 * np.random.rand(100, 1)y = 4 + 3 * X + np.random.randn(100, 1)# 梯度下降回归sgd_reg = SGDR... 阅读全文

posted @ 2018-07-08 17:33 云山之巅阅读(4106) 评论(0) 推荐(0) 编辑

Python之岭回归

摘要：实现：# -*- coding: UTF-8 -*-import numpy as npfrom sklearn.linear_model import Ridge__author__ = 'zhen'X = 2 * np.random.rand(100, 1)y = 4 + 3 * X + np.random.randn(100, 1)# 岭回归ridge_reg = Ridge(alpha=1... 阅读全文

posted @ 2018-07-08 17:19 云山之巅阅读(1261) 评论(0) 推荐(0) 编辑

Python之随机梯度下降

摘要：实现：# -*- coding: UTF-8 -*-""" 练习使用随机梯度下降算法"""import numpy as npimport math__author__ = 'zhen'# 生成测试数据x = 2 * np.random.rand(100, 1) # 随机生成100*1的二维数组，值分别在0~2之间y = 4 + 3 * x + np.random.randn(100, 1... 阅读全文

posted @ 2018-07-08 17:10 云山之巅阅读(2433) 评论(0) 推荐(0) 编辑

Python数据清洗基本流程

摘要：# -*- coding: utf-8 -*-"""Created on Wed Jul 4 18:40:55 2018 @author: zhen""" import pandas as pdimport numpy as np# 创建空的df，保存测试数据test_df = pd.DataFra 阅读全文

posted @ 2018-07-05 10:17 云山之巅阅读(6455) 评论(0) 推荐(1) 编辑

Python实现批量梯度下降算法

摘要：# -*- coding: UTF-8 -*-import numpy as npimport math# 定义基础变量learning_rate = 0.1n_iterations = 10000m = 100x = 2 * np.random.rand(m, 1) # 生成一组服从0~1均匀分布的随机样本，此处表示生成100行一列的二维数组，下同y = 4 + 3 * x + np.rand... 阅读全文

posted @ 2018-07-02 19:52 云山之巅阅读(2165) 评论(0) 推荐(0) 编辑

云山之巅

------自学是你超越他人使自己变的重要的一种能力！

07 2018 档案

公告

最新随笔

我的标签

积分与排名

随笔分类 (82)

随笔档案 (315)

相册 (11)

阅读排行榜

评论排行榜

推荐排行榜

最新评论