摘要:Filter methodsThese include simple statistical test to determine if a feature is statistically significant for example the p value for a t test to det 阅读全文
matplotlib 画图
2018-01-12 11:34 by xplorerthik, 186 阅读, 0 推荐, 收藏, 编辑
摘要:import matplotlib.pyplot as plt fig, ax =plt.subplot(111) fig 主要用于 1: figure-level attributes 2: 保存画图 fig.savefig('yourfilename.png'). ax 主要是在当前的图上进行轴 阅读全文
Mac anzhuangxgboost
2018-01-11 16:01 by xplorerthik, 170 阅读, 0 推荐, 收藏, 编辑
摘要:2. 从Github库安装XGBoost 第一步, 克隆最新的XGBoost到本地 git clone --recursive https://github.com/dmlc/xgboost 第二步, 安装gcc和g++ brew install gcc5 --without-multilib 没有 阅读全文
scala _ parameter
2018-01-09 17:15 by xplorerthik, 157 阅读, 0 推荐, 收藏, 编辑
摘要:Given that sequence, use reduceLeft to determine different properties about the collection. The following example shows how to get the sum of all the 阅读全文
cv 验证
2018-01-03 16:51 by xplorerthik, 345 阅读, 0 推荐, 收藏, 编辑
摘要:This is how I have trained a xgboost classifier with a 5-fold cross-validation to optimize the F1 score using randomized search for hyperparameter opt 阅读全文
groupie
2017-12-28 15:34 by xplorerthik, 187 阅读, 0 推荐, 收藏, 编辑
摘要:def add_group(group): c = group.c.astype('float') group['d'] = c/c.sum() return group df = pd.DataFrame({'a':[3,4,5,2,5,3], 'b':[3,2,1,2,2,3]}) df['c' 阅读全文
pandas map, apply, applymap区别
2017-12-28 11:47 by xplorerthik, 2250 阅读, 0 推荐, 收藏, 编辑
摘要:map只对一个序列而言的。 apply只是整个dataframe上任意一列或多列,或者一行或多行, 即可在任意轴操作。 在一列使用apply时,跟map效果一样。 多列时只能用apply。 applymap 在整个dataframe的每个元素使用一个函数。 Map: It iterates over 阅读全文
画图
2017-12-22 11:09 by xplorerthik, 183 阅读, 0 推荐, 收藏, 编辑
摘要:data = pd.read_csv('http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv', index_col=0) print(data.head()) import seaborn as sns %matplotlib inline sns. 阅读全文
xgboost dmatrix中的 weight的重要性
2017-11-01 19:59 by xplorerthik, 3011 阅读, 0 推荐, 收藏, 编辑
摘要:https://stackoverflow.com/questions/35983565/how-is-the-parameter-weight-dmatrix-used-in-the-gradient-boosting-procedure xgboost allows for instance w 阅读全文
自然语言处理的训练范式
2017-09-21 11:18 by xplorerthik, 297 阅读, 0 推荐, 收藏, 编辑
摘要:NLP Training Paradigms: 1. Joint Learning models; 2. Decoupling learning from Inference; 3. Constrained Driven Learning; 4. Semi-Supervised Learning o 阅读全文