代码改变世界

二项分布 , 多项分布, 以及与之对应的beta分布和狄利克雷分布

2017-09-10 09:49 by xplorerthik, 1594 阅读, 0 推荐, 收藏, 编辑
摘要:1. 二项分布与beta分布对应 2. 多项分布与狄利克雷分布对应 3. 二项分布是什么?n次bernuli试验服从 二项分布 二项分布是N次重复bernuli试验结果的分布。 bernuli实验是什么?做一次抛硬币实验,该试验结果只有2种情况,x= 1, 表示正面。 x=0,表示反面。 bernu 阅读全文

模型经验调参

2017-09-08 15:22 by xplorerthik, 152 阅读, 0 推荐, 收藏, 编辑
摘要: 阅读全文

grid search 超参数寻优

2017-09-05 13:39 by xplorerthik, 1433 阅读, 0 推荐, 收藏, 编辑
摘要:http://scikit-learn.org/stable/modules/grid_search.html 1. 超参数寻优方法 gridsearchCV 和 RandomizedSearchCV 2. 参数寻优的技巧进阶 2.1. Specifying an objective metric 阅读全文

grid search

2017-09-04 11:56 by xplorerthik, 499 阅读, 0 推荐, 收藏, 编辑
摘要:sklearn.metrics.make_scorer(score_func, greater_is_better=True, needs_proba=False, needs_threshold=False, **kwargs)[source]¶ >>> from sklearn.metrics 阅读全文

pipeline 对部分特征进行处理

2017-08-17 14:24 by xplorerthik, 533 阅读, 0 推荐, 收藏, 编辑
摘要:http://scikit-learn.org/stable/auto_examples/preprocessing/plot_function_transformer.html#sphx-glr-auto-examples-preprocessing-plot-function-transform 阅读全文

pandas dataframe 满足条件的样本提取

2017-08-05 10:43 by xplorerthik, 13899 阅读, 0 推荐, 收藏, 编辑
摘要:pandas 的dataframe 对 数据查询可以通过3种方式 。 预备知识: 1. pandas 的索引和label都是从0开始的计数的 2. 时间切片都是左闭右开的。 [5:6,:] 只会输出index =5的那一行值。 pd.dataframe的3种方式实现数据查询 1. 取其中的一个元素 阅读全文

python 添加日期

2017-08-01 10:35 by xplorerthik, 444 阅读, 0 推荐, 收藏, 编辑
摘要:import pandas as pd applydata['apply_time'] = pd.to_datetime(applydata.apply_time)# applydata.apply_time = 2016-04-06 14:30:06:applydata['apply_date'] 阅读全文

R dataframe 遗忘, which 矩阵搜索

2017-07-25 16:31 by xplorerthik, 567 阅读, 0 推荐, 收藏, 编辑
摘要:A data frame is used for storing data tables. It is a list of vectors of equal length. For example, the following variable df is a data frame containi 阅读全文

sklearn scoring . xgboost.train . ---> rsme

2017-07-25 13:54 by xplorerthik, 719 阅读, 0 推荐, 收藏, 编辑
摘要:http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter 3.3.1. The scoring parameter: defining model evaluation rules Model sel 阅读全文

pandas. dataframe

2017-07-25 10:55 by xplorerthik, 166 阅读, 0 推荐, 收藏, 编辑
摘要:loc works on labels in the index. iloc works on the positions in the index (so it only takes integers). ix usually tries to behave like loc but falls 阅读全文