05 2011 档案

摘要:0. 下载scipy与numpy的package http://www.scipy.org/Download#head-e68e4e32955ab584e1ac94e2b767f00179eac137 1. sudo apt-get install libatlas-sse2-dev(科学计算库) 2. sudo apt-get install gfortran(编译器) 3. 执行下面的命令: 在安装libatlas-sse2-dev2后,libblas.so的路径为:/usr/lib/sse2/atlas/ 4. 进入numpy的目录, 执行(安装numpy) python setup.p 阅读全文
posted @ 2011-05-29 21:08 LeftNotEasy 阅读(6511) 评论(1) 推荐(0) 编辑
摘要:项目首页: http://code.google.com/p/python-data-mining-platform/ (可能需FQ) 目前比如tutorial, install, release等内容,已经更新到项目首页的wiki中 项目介绍: 这是一个能够根据源数据(比如说用csv格式表示的矩阵,或者中文文档)使用多种多样的算法去得到结果的一个平台。 算法能够通过xml配置文件去一个一个的运行,比如在开始的时候,我们可以先运行一下主成分分析算法去做特种选择,然后我们再运行随机森林算法来做分类。 目前算法主要是针对那些单机能够完成的任务,该架构良好的扩展性能够让你在很短的时间内完成自己想要的 阅读全文
posted @ 2011-05-29 20:24 LeftNotEasy 阅读(9214) 评论(12) 推荐(3) 编辑
摘要:目前算法主要是针对那些单机能够完成的任务,该架构良好的扩展性能够让你在很短的时间内完成自己想要的算法,并且用于工程之中(相信我,肯定比Weka更快更好)。该项目的另一个特色是能够很好的支持中文文本的分类、聚类等操作。 *当前版新增 加入了K-Means算法,能够对文本进行聚类 加入了基于补集的朴素贝叶斯算法,大大提升了分类的准确率,目前该算法在搜狗实验室文本分类数据中,对20000篇、8分类左右的数据的预测准确率在90%左右 阅读全文
posted @ 2011-05-15 22:21 LeftNotEasy 阅读(14898) 评论(5) 推荐(8) 编辑
摘要:版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @leftnoteasy 前言: 又有很长的一段时间没有更新博客 阅读全文
posted @ 2011-05-02 20:56 LeftNotEasy 阅读(173904) 评论(42) 推荐(52) 编辑
摘要:在我的博客中,推荐以下专题 机器学习中的数学系列: 1) 回归(regression)、梯度下降(gradient descent) 2) 线性回归,偏差、方差权衡 3) 模型组合(Model Combining)之Boosting与Gradient Boosting 4) 线性判别分析(LDA), 阅读全文
posted @ 2011-05-02 10:13 LeftNotEasy 阅读(4531) 评论(0) 推荐(13) 编辑

点击右上角即可分享
微信分享提示