摘要: 大家在通过pip 或conda 下载一些很大的第三方库时是不是有一种等到坟头的草都三尺高了,还没下载完的感觉,而且大的第三方库长时间下载,可能会导致超时自动中断下载,感谢清华的大佬们 临时使用: pip install -i https://pypi.tuna.tsinghua.edu.cn/sim 阅读全文
posted @ 2019-12-16 11:36 张知行 阅读(5500) 评论(0) 推荐(0) 编辑
摘要: 链接:https://pan.baidu.com/s/1aaWgTY8P2J8fNdXFRSnHug 提取码:p5wa 复制这段内容后打开百度网盘手机App,操作更方便哦 阅读全文
posted @ 2019-11-18 10:10 张知行 阅读(1219) 评论(0) 推荐(1) 编辑
摘要: a = pd.DataFrame([[1,2,3], [4,5,6], [7,8,9]],columns=['a','b','c']) b = pd.DataFrame([[11,23,45], [22,23,24], [31,32,33]],columns=['a','b','c']) pd.concat([a,b],axis=0,ignore_index=True) 阅读全文
posted @ 2019-10-14 13:51 张知行 阅读(1441) 评论(0) 推荐(0) 编辑
摘要: 我们都知道,在调用sklearn中的随机森林时,是可以通过feature_importances_查看每个特征的重要程度的。 其主要通过置换检验来求得特征的重要程度。 如果特征k是重要的,那么用随机的值将该列特征破坏,重新训练和评估,计算模型的泛化能里的退化程度,即: inportance(k) = 阅读全文
posted @ 2019-08-01 11:36 张知行 阅读(1973) 评论(0) 推荐(0) 编辑
摘要: 随机森林oob的理解 阅读全文
posted @ 2019-07-08 11:58 张知行 阅读(5006) 评论(0) 推荐(0) 编辑
摘要: pandas中groupby的参数:as_index的见解 阅读全文
posted @ 2019-06-23 21:17 张知行 阅读(18782) 评论(0) 推荐(1) 编辑
摘要: 机器学习实战笔记——使用 k-近邻算法改进约会网站的配对效果 阅读全文
posted @ 2019-06-20 15:27 张知行 阅读(398) 评论(0) 推荐(0) 编辑
摘要: 机器学习实战中的KNN基本代码 阅读全文
posted @ 2019-06-18 20:50 张知行 阅读(310) 评论(0) 推荐(0) 编辑