上一页 1 2 3 4 5 6 ··· 9 下一页
摘要: 关于支持向量机SVM,这里也只是简单地作个要点梳理,尤其是要注意的是SVM的SMO优化算法、核函数的选择以及参数调整。在此不作过多阐述,单从应用层面来讲,重点在于如何使用libsvm,但对其原理算法要理解。 SVM理论推导是有些复杂的,关键是怎么把目标函数在约束条... 阅读全文
posted @ 2014-11-02 21:07 DianaCody 阅读(333) 评论(0) 推荐(0) 编辑
摘要: 一、LR分类器(Logistic Regression Classifier) 在分类情形下,经过学习后的LR分类器是一组权值w0,w1, …, wn,当测试样本的数据输入时,这组权值与测试数据按照线性加和得到x = w0+w1x1+w2x2+… wnxn,这里x1,x2, …x... 阅读全文
posted @ 2014-11-02 15:33 DianaCody 阅读(5510) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯主要用于文本分类。文本分类常见三大算法:KNN、朴素贝叶斯、支持向量机SVM。 一、贝叶斯定理 贝叶斯公式思想:利用已知值来估计未知概率。已知某条件概率,如何得到两个事件交换后的概率,也就是已知P(A|B)的情况下如何求得P(B|A)。 ... 阅读全文
posted @ 2014-11-02 09:45 DianaCody 阅读(1346) 评论(0) 推荐(0) 编辑
摘要: 随机森林(RF, RandomForest)包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。通过自助法(boot-strap)重采样技术,不断生成训练样本和测试样本,由训练样本生成多个分类树组成的随机森林,测试数据的分类结果按分类树投票多少形成的分数而定。... 阅读全文
posted @ 2014-11-02 08:20 DianaCody 阅读(750) 评论(0) 推荐(0) 编辑
摘要: 一、决策树模型组合 单决策树C4.5由于功能太简单,并且非常容易出现过拟合的现象,于是引申出了许多变种决策树,就是将单决策树进行模型组合,形成多决策树,比较典型的就是迭代决策树GBRT和随机森林RF。 在最近几年的paper上,如iccv这种重量级会议,iccv ... 阅读全文
posted @ 2014-11-01 23:29 DianaCody 阅读(7751) 评论(0) 推荐(2) 编辑
摘要: 一、算法流程 step1:计算信息熵 step2: 划分数据集 step3: 创建决策树 step4: 利用决策树分类 二、信息熵Entropy、信息增益Gain 重点:选择一个属性进行分支。... 阅读全文
posted @ 2014-11-01 21:50 DianaCody 阅读(342) 评论(0) 推荐(0) 编辑
摘要: 一、写在前面 本系列是对之前机器学习笔记的一个总结,这里只针对最基础的经典机器学习算法,对其本身的要点进行笔记总结,具体到算法的详细过程可以参见其他参考资料和书籍,这里顺便推荐一下Machine Learning in Action一书和Ng的公开课,当然仅有这些是远远不够的,更... 阅读全文
posted @ 2014-11-01 16:56 DianaCody 阅读(3200) 评论(0) 推荐(0) 编辑
摘要: 一、概述 linux开启进程都是与终端绑定的,终端一关,进程也关,如果想独立不受干扰,必须将此进程变为守护进程(在后台运行,不以终端方式与用户交互)。 守护进程能够突破这种限制,它从被执行开始运转,直到整个系统关闭时才退出。如果想让某个进程不因为用户或终端或其他地... 阅读全文
posted @ 2014-10-12 12:27 DianaCody 阅读(2171) 评论(0) 推荐(1) 编辑
摘要: 最近做的新浪微博爬虫程序,打算打包成.exe软件以方便使用,网上找到一个很好的打包工具pyinstaller,这里记录一下打包的方法。 一、下载pyinstaller 我使用的版本为PyInstaller-2.1,支持python版本2.3-2.7,点击这里下载。 二、安... 阅读全文
posted @ 2014-10-03 23:46 DianaCody 阅读(11178) 评论(1) 推荐(0) 编辑
摘要: 在上一篇文章的末尾,我们创建了一个scrapy框架的爬虫项目test,现在来运行下一个简单的爬虫,看看scrapy爬取的过程是怎样的。 一、爬虫类编写(spider.py) from scrapy.spider import BaseSpiderclass test(Bas... 阅读全文
posted @ 2014-10-03 09:57 DianaCody 阅读(537) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 9 下一页