随笔档案「2018年1月」 - xingoo

Spark机器学习——模型选择与参数调优之交叉验证

摘要：spark 模型选择与超参调优机器学习可以简单的归纳为通过数据训练的过程，因此定义完训练模型之后，就需要考虑如何选择最终我们认为最优的模型。如何选择最优的模型，就是本篇的主要内容：模型验证的方法超参数的选择评估函数的选择模型验证的方法在《统计学习方法》这本书中，曾经讲过模型验证的方阅读全文

posted @ 2018-01-30 15:57 xingoo 阅读(2479) 评论(0) 推荐(0)

Spark Client启动原理探索

摘要：经过几天闲暇时间的学习，终于又理解的深入了一些，关于Spark Client如何提交作业也更清晰了点。在整体的流程图上是这样的：大体的思路就是应用程序通过SparkSubmit提交程序后，自动在当前的JVM中启动Driver，然后与Master通信创建Excutor执行相应的任务。自己整理了下阅读全文

posted @ 2018-01-20 00:11 xingoo 阅读(817) 评论(0) 推荐(0)

Spark源码分析之 Driver和Excutor是怎么跑起来的?(2.2.0版本)

摘要：今天抽空回顾了一下Spark相关的源码，本来想要了解一下Block的管理机制，但是看着看着就回到了SparkContext的创建与使用。正好之前没有正式的整理过这部分的内容，这次就顺带着回顾一下。更多内容参考： "我的大数据之路" Spark作为目前最流行的大数据计算框架，已经发展了几个年头了。版阅读全文

posted @ 2018-01-10 19:13 xingoo 阅读(2160) 评论(0) 推荐(2)

《恶意》—— 读后总结

摘要：这本小说，从案件剧情上来说，简单的不要不要的，可是背后的故事确是一波三折，把读者骗的来回转。小说整体采用了一种叫做POV, point of view 视点人物写作手法。之前看过辛夷坞的小说，是那种每个人都描述同一件事情，读者从不同人物角度的来挖掘事件的真相。本书则是站在每个人不同的视角讲述故事，阅读全文

posted @ 2018-01-06 12:18 xingoo 阅读(2016) 评论(0) 推荐(0)

基于Dubbo的http自动测试工具分享

摘要：公司是采用微服务来做模块化的，各个模块之间采用dubbo通信。好处就不用提了，省略了之前模块间复杂的http访问。不过也遇到一些问题： PS: "Github的代码示例" 测试需要配合写消费者的代码对于开发来说，倒是挺省劲。但是对于测试来说就有点麻烦了, 每次还要去写dubbo的消费程序，而且每次阅读全文

posted @ 2018-01-05 17:35 xingoo 阅读(5277) 评论(1) 推荐(6)

xingoo

01 2018 档案

公告