随笔档案「2016年11月」 - 混沌战神阿瑞斯

scikit-learn的梯度提升算法（Gradient Boosting）使用

摘要：摘要：　　1.示例　　2.模型主要参数　　3.模型主要属性变量阅读全文

posted @ 2016-11-28 13:40 混沌战神阿瑞斯阅读(6169) 评论(0) 推荐(0)

摘要：摘要：　　1.pipeline 模式　　　　1.1相关概念　　　　1.2代码示例　　2.特征提取，转换以及特征选择　　　　2.1特征提取　　　　2.2特征转换　　　　2.3特征选择　　3.模型选择与参数选择　　　　3.1 交叉验证　　　　3.2 训练集-测试集切分阅读全文

posted @ 2016-11-25 18:27 混沌战神阿瑞斯阅读(1115) 评论(0) 推荐(0)

python面向对象随笔

摘要：传送门：http://www.runoob.com/python/python-object.html 阅读全文

posted @ 2016-11-20 20:06 混沌战神阿瑞斯阅读(231) 评论(0) 推荐(0)

推荐系统架构（摘自《推荐系统实践》）

摘要：摘要：　　1.外围架构　　2.推荐系统架构阅读全文

posted @ 2016-11-19 19:50 混沌战神阿瑞斯阅读(385) 评论(0) 推荐(0)

推荐系统常用测评方法和指标

摘要：摘要：　　1.用户满意度　　　　在线测评方法　　2.预测准确率　　 2.1评分预测　　 2.2TopN推荐　　3.覆盖率（coverage）　　4.多样性　　5.新颖性阅读全文

posted @ 2016-11-16 23:23 混沌战神阿瑞斯阅读(3619) 评论(0) 推荐(0)

Spark Shuffle原理、Shuffle操作问题解决和参数调优

摘要：摘要：　1 shuffle原理　　1.1 mapreduce的shuffle原理　　　　1.1.1 map task端操作　　　　1.1.2 reduce task端操作　　 1.2 spark现在的SortShuffleManager 2 Shuffle操作问题解决　　 2.1 数据倾斜原理 2.2 数据倾斜问题发现与解决 2.3 数据倾斜解决方案 3 spark RDD中的shuffle算子 3.1 去重 3.2 聚合 3.3 排序 3.4 重分区 4 spark shuffle参数调优阅读全文

posted @ 2016-11-11 16:55 混沌战神阿瑞斯阅读(31601) 评论(8) 推荐(2)

10 Minutes to pandas

摘要：摘要　一、创建对象　　　　　　二、查看数据　　三、选择和设置　　四、缺失值处理　　五、相关操作　　六、聚合　　七、重排(Reshaping) 　　八、时间序列　　　　九、Categorical类型　十、画图十一、导入和保存数据阅读全文

posted @ 2016-11-05 22:51 混沌战神阿瑞斯阅读(780) 评论(0) 推荐(0)

Java的默认编码

摘要：摘要：　　　　　　1.Java的默认编码阅读全文

posted @ 2016-11-04 15:55 混沌战神阿瑞斯阅读(1201) 评论(0) 推荐(0)

spark参数调优

摘要：摘要　　1.num-executors 　　2.executor-memory 　　3.executor-cores 　　4.driver-memory 　　5.spark.default.parallelism 　　6.spark.storage.memoryFraction 　　7.spark.shuffle.memoryFraction 　　8.资源参数参考示例阅读全文

posted @ 2016-11-03 23:04 混沌战神阿瑞斯阅读(14201) 评论(0) 推荐(3)

Spark的持久化简记

摘要：摘要：　　1.spark 提供的持久化方法　　2.Spark的持久化级别　　3.如何选择一种最合适的持久化策略阅读全文

posted @ 2016-11-03 21:47 混沌战神阿瑞斯阅读(1113) 评论(0) 推荐(1)

混沌战神阿瑞斯

环境，机遇，能力

11 2016 档案

公告