随笔档案「2018年8月」 - 云山之巅

摘要：代码实现：基于决策树回归：基于决策树分类：总结：可知在使用同一数据源抽样训练模型中，使用回归进行拟合比使用分类效果更好！阅读全文

posted @ 2018-08-30 15:52 云山之巅阅读(379) 评论(0) 推荐(0)

摘要：实现代码：结果：不同深度对预测的影响：总结：决策树分量算法有构造速度快、结构明显、分类精度高等优点。决策树是以实例(Instance)为核心的归纳分类方法。它从一组无序的、无特殊领域知识的数据集中提取出决策树表现形式的分类规则，包含了分支节点、叶子节点和分支结构。它采用自顶向下的递归方阅读全文

posted @ 2018-08-29 16:57 云山之巅阅读(2200) 评论(0) 推荐(0)

神经网络MPLClassifier分类

摘要：代码：结果： max_iter=10 max_iter=20 注意： 1.　当使用pickle加载mnist数据时，python3.x与python2.x差距较大，python3.x会抛出异常，异常信息为：UnicodeDecodeError: 'ascii' codec can't decode 阅读全文

posted @ 2018-08-24 16:53 云山之巅阅读(1761) 评论(0) 推荐(0)

Scala多重继承及AOP

摘要：结果：阅读全文

posted @ 2018-08-23 17:19 云山之巅阅读(466) 评论(0) 推荐(0)

Spark编译

摘要：Spark的运行版本使用mvn编译，已经集成在源码中。如果机器有外网或者配置了http代理，可以直接调用编译命令来进行编译。 windows&Linux命令如下： ./build/mvn \ -Phadoop-x.y \ -Dhadoop.version=x.y.z \ -Pyarn \ -Dyar 阅读全文

posted @ 2018-08-22 17:20 云山之巅阅读(317) 评论(0) 推荐(0)

音乐分类

摘要：代码：结果：阅读全文

posted @ 2018-08-21 20:39 云山之巅阅读(414) 评论(0) 推荐(0)

软件设计师【计算机组成原理基础知识及相关试题】

摘要：or 印象深刻！一.设备管理二.磁盘管理三.存储管理四.试题五.备注 1.计算机体系结构分类常为：Flynn分类法（常考）和冯氏分类法。 2.流水线要求所有的流水级部件必须在相同的时间内完成各自的子过程。因此机器周期的长度由最慢的流水级部件花费的时间决定！ 3.流水线执行时间：(N+k-1 阅读全文

posted @ 2018-08-19 16:04 云山之巅阅读(369) 评论(0) 推荐(0)

软件设计师【编程语言：C语言、面向对象语言】

摘要：or 一.C语言试题一个无向连通图G点上的哈密尔顿（Hamiltion）回路是指从图G上的某个顶点出发，经过图上所有其他顶点一次且仅一次，最后回到该顶点的路劲。一种求解无向图上哈密尔顿回路算法的基础实现如下：假设图G存在一个从顶点V0出发的哈密尔顿回路V1——V2——V3——...——Vn-1— 阅读全文

posted @ 2018-08-18 11:40 云山之巅阅读(662) 评论(0) 推荐(0)

Pinyin4j实战

摘要：结果：分析：在多音字方面确实存在不少问题，会导致在一些使用情况下出现异常！阅读全文

posted @ 2018-08-17 11:08 云山之巅阅读(409) 评论(0) 推荐(0)

软件设计师【ER模型试题】

摘要：M公司为了便于开展和管理各项业务活动，提高公司的知名度和影响力，拟构建一个基于网络的会议策划系统。【需求分析结果】该系统的部分功能及初步需求分析的结果如下：（1）M公司旗下有业务部、策划部和其他部门。部门信息包括部门号、部门名、主管、联系电话和邮箱号；每个部门只有一名主管，只负责管理本部门的阅读全文

posted @ 2018-08-15 14:28 云山之巅阅读(1726) 评论(0) 推荐(0)

软件设计师【数据流图】

摘要：一.概述二.试题试题1. 某公司拟开发一个共享单车系统，采用北斗定位系统进行单车定位，提供针对用户的APP以及微信小程序、基于Web的管理与监控系统。该共享单车系统的主要功能如下。 1）用户注册登录。用户在APP端输入手机号并获取验证码后进行注册，将用户信息进行存储。用户登录后显示用户所在位置周阅读全文

posted @ 2018-08-14 11:46 云山之巅阅读(3853) 评论(0) 推荐(1)

软件设计师【操作系统基础知识及相关试题】

摘要：or 一.存储管理 1.页式存储 2.段式存储 3.段页式存储二.置换算法及局部性原理三.PV操作 1.临界资源：诸进程需要互斥方式对其进行共享的资源。 2.临界区：每个进程中访问临界资源的那段代码。 3.信号量：一种特殊的变量。四.试题 1. 2. 3. 4. 5. 阅读全文

posted @ 2018-08-06 20:32 云山之巅阅读(655) 评论(0) 推荐(0)

persist与checkpoint

摘要：1.当反复使用某些RDD时建议使用persist(缓存级别)（采用默认缓存级别时为cache()）来对数据进行缓存。 2.如果某个步骤的RDD计算特别耗时或经历很多步骤的计算，当重新计算时代价特别大，此时应考虑使用checkpoint，对DAG做检查点，将中间结果保存到高可用（一般是HDFS）的地方阅读全文

posted @ 2018-08-05 18:43 云山之巅阅读(353) 评论(0) 推荐(0)

Spark内存使用分析及优化【SparkCore、Spark SQL】

摘要：一.内存检测 1.JVM自带众多内存诊断的工具，例如：JMap,JConsole等，以及第三方IBM JVM Profile Tools等。 2.在开发、测试、生产环境中最合适的就是日志，特别是Driver产生的日志！调用RDD.cache()，当进行cache()操作时，Driver上的Block 阅读全文

posted @ 2018-08-05 18:27 云山之巅阅读(1061) 评论(0) 推荐(0)

Spark程序数据结构优化

摘要：场景： 1.scala中的对象：对象头是16个字节（包含指向对象的指针等源数据信息），如果对象中只有一个int的属性，则会占用20个字节，也就是说对象的源数据占用了大部分的空间，所以在封装数据的时候尽量不要使用对象！可以使用诸如：JSON来封装数据。 2.scala中基本的数据类型会自动进行封箱操作阅读全文

posted @ 2018-08-05 18:20 云山之巅阅读(399) 评论(0) 推荐(0)

软件设计师考试17年下半年上午考试真题及解析(三)

摘要：11.系统交付用户使用后，为了改进系统的图形输出而对系统进行修改的维护行为属于（36）维护。 A.改正性 B.适应性 C.改善性 D.预防性答案：C 解析：正确性维护：改正在测试阶段未发现而在用户使用期间发现的软件错误适应性维护：技术，需求发生了变化而引起的维护完善性维护：扩展功能和完善性能阅读全文

posted @ 2018-08-03 10:57 云山之巅阅读(1342) 评论(0) 推荐(0)

Python之逻辑回归

摘要：代码：结果：训练1：训练2：训练3：训练4：分析：有训练结果可知，训练4最具有合理性（分类清晰）：阅读全文

posted @ 2018-08-02 18:07 云山之巅阅读(310) 评论(0) 推荐(0)

软件设计师【编译原理】

摘要：or 一.编译与解释编译型：将某种程序语言编写的源程序直接翻译成另一种语言（目标语言程序），而且两者在逻辑上完全等价。例如：C语言。解释型：接收所输入的源程序，然后直接解释执行。例如：Basic语言。二.编译过程使用编译程序将高级语言程序翻译为等价的机器语言程序的过程。分为：词法分析、语阅读全文

posted @ 2018-08-01 18:36 云山之巅阅读(431) 评论(0) 推荐(0)

云山之巅

------自学是你超越他人使自己变的重要的一种能力！

08 2018 档案

公告