05 2017 档案

数字签名&Xshell界面&ssh
摘要:http://www.ruanyifeng.com/blog/2011/08/what_is_a_digital_signature.html http://blog.csdn.net/houjiyu243042162/article/details/44344269 http://www.ruan 阅读全文

posted @ 2017-05-23 17:27 易然~ 阅读(213) 评论(0) 推荐(0) 编辑

【scikit-learn】网格搜索来进行高效的参数调优
摘要:内容概要¶ 如何使用K折交叉验证来搜索最优调节参数 如何让搜索参数的流程更加高效 如何一次性的搜索多个调节参数 在进行真正的预测之前,如何对调节参数进行处理 如何削减该过程的计算代价 1. K折交叉验证回顾¶ 交叉验证的过程 选择K的值(一般是10),将数据集分成K等份 使用其中的K-1份数据作为训 阅读全文

posted @ 2017-05-23 16:18 易然~ 阅读(6186) 评论(0) 推荐(0) 编辑

Python_sklearn机器学习库学习笔记(四)decision_tree(决策树)
摘要:# 决策树 import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.cross_validation import train_test_split from sklearn.metrics i 阅读全文

posted @ 2017-05-23 16:16 易然~ 阅读(6597) 评论(0) 推荐(0) 编辑

结合Scikit-learn介绍几种常用的特征选择方法
摘要:转:http://www.17bigdata.com/%E7%BB%93%E5%90%88scikit-learn%E4%BB%8B%E7%BB%8D%E5%87%A0%E7%A7%8D%E5%B8%B8%E7%94%A8%E7%9A%84%E7%89%B9%E5%BE%81%E9%80%89%E6 阅读全文

posted @ 2017-05-23 16:10 易然~ 阅读(247) 评论(0) 推荐(0) 编辑

评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)
摘要:下面简单列举几种常用的推荐系统评测指标: 1、准确率与召回率(Precision & Recall) 准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中 阅读全文

posted @ 2017-05-18 11:28 易然~ 阅读(454) 评论(0) 推荐(0) 编辑

Python格式化输出
摘要:转:http://www.cnblogs.com/plwang1990/p/3757549.html 1. 打印字符串 print ("His name is %s"%("Aviad")) 效果: 2.打印整数 print ("He is %d years old"%(25)) 效果: 3.打印浮点 阅读全文

posted @ 2017-05-08 11:38 易然~ 阅读(175) 评论(0) 推荐(0) 编辑

机器学习-KMeans聚类 K值以及初始类簇中心点的选取
摘要:【转】http://www.cnblogs.com/kemaswill/archive/2013/01/26/2877434.html 本文主要基于Anand Rajaraman和Jeffrey David Ullman合著,王斌翻译的《大数据-互联网大规模数据挖掘与分布式处理》一书。 KMeans 阅读全文

posted @ 2017-05-07 23:43 易然~ 阅读(7699) 评论(0) 推荐(0) 编辑

[聚类算法]K-means优缺点及其改进
摘要:[聚类算法]K-means优缺点及其改进 【转】:http://blog.csdn.net/u010536377/article/details/50884416 K-means聚类小述 大家接触的第一个聚类方法,十有八九都是K-means聚类啦。该算法十分容易理解,也很容易实现。其实几乎所有的机器 阅读全文

posted @ 2017-05-07 23:38 易然~ 阅读(2846) 评论(0) 推荐(0) 编辑

【知乎转载】机器学习、数据挖掘 如何进阶成为大神?
摘要:著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:淩清风 链接:https://www.zhihu.com/question/37256015/answer/85198013 来源:知乎 我不是大神。 背景:某二本院校大四学生; 说一说自己的学习经历吧。不知道能不能对题主 阅读全文

posted @ 2017-05-07 22:47 易然~ 阅读(3964) 评论(0) 推荐(0) 编辑

数据挖掘学习清单
摘要:数据挖掘学习清单 基础篇 矩阵背后的现实意义 概率分布 无约束最优化方法 拉格朗日乘子法和KKT条件 推荐 相关性检验 协同过滤推荐算法 分类 朴素贝叶斯 LR SVM 聚类 KMeans DBScan CHAMELEON GMM 决策树 ID3 C4.5 Adaboost GBDT 关联规则挖掘 阅读全文

posted @ 2017-05-07 22:25 易然~ 阅读(172) 评论(0) 推荐(0) 编辑

scikit-learn决策树算法类库使用小结
摘要:转:http://www.cnblogs.com/pinard/p/6056319.html scikit-learn决策树算法类库使用小结 之前对决策树的算法原理做了总结,包括决策树算法原理(上)和决策树算法原理(下)。今天就从实践的角度来介绍决策树算法,主要是讲解使用scikit-learn来跑 阅读全文

posted @ 2017-05-05 15:09 易然~ 阅读(494) 评论(0) 推荐(0) 编辑

KMeans
摘要:一、聚类算法:from sklearn.cluster import KMeans (一)输入参数: (1)n_clusters:要分成的簇数也是要生成的质心数 类型:整数型(int) 默认值:8 n_clusters : int, optional, default: 8 The number o 阅读全文

posted @ 2017-05-04 11:25 易然~ 阅读(2791) 评论(0) 推荐(0) 编辑

导航

点击右上角即可分享
微信分享提示