随笔分类 -  data Mining

机器学习,数据挖掘
深度学习-LeCun、Bengio和Hinton的联合综述
摘要:深度学习其实要入门也很简单,不要被深度学习、卷积神经网络CNN、循环神经网络RNN等某些“高大上”的专有名词所吓到或被忽悠,要相信大道至简,一个高中生只要愿意学也完全可以入门级了解并依赖一些成熟的Tensorflow、pytorch等框架去实现一些常用模型。有关《深度学习》的综述或翻译已有很多,在此 阅读全文
posted @ 2019-06-10 13:17 星空守望者--jkmiao 阅读(1833) 评论(0) 推荐(2) 编辑
keras LSTM学习实例
摘要:1. 购物时间预测 http://www.cnblogs.com/arkenstone/p/5794063.html https://github.com/CasiaFan/time_seires_prediction_using_lstm 2. 简单实例 阅读全文
posted @ 2017-01-22 14:48 星空守望者--jkmiao 阅读(1278) 评论(0) 推荐(0) 编辑
深度学习性能提升的诀窍
摘要:深度学习性能提升的诀窍[转载] 原文: How To Improve Deep Learning Performance 作者: Jason Brownlee 提升算法性能的想法 这个列表并不完整,却是很好的出发点。我的目的是给大家抛出一些想法供大家尝试,或许有那么一两个有效的方法。往往只需要尝试一 阅读全文
posted @ 2016-10-15 09:22 星空守望者--jkmiao 阅读(9737) 评论(0) 推荐(2) 编辑
各种分类算法比较
摘要:1决策树(Decision Trees)的优缺点决策树的优点:一、 决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。二、 对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往要求先把数据一般化,比如去掉多余的或者空白的属性。三、 能够同时处理数据型和常规... 阅读全文
posted @ 2016-01-13 21:50 星空守望者--jkmiao 阅读(557) 评论(0) 推荐(0) 编辑
NLP学习资源
摘要:JournalsACM Transactions on Information Systems (TOIS)影响因子5.059(2006)IEEE Transactions on Knowledge and Data Engineering(TKDE),影响因子:2.063Information R... 阅读全文
posted @ 2015-10-28 15:14 星空守望者--jkmiao 阅读(355) 评论(0) 推荐(0) 编辑
kddcup2015
摘要:kddcup2015,二分类,课程逃课预测。写了好久了,突然想起简单整理一下,以备后需。 step1,预处理,利用numpy和pandas库,数值化特征,简单而优雅 2. 使用各种机器学习方法进行建模,预测 3, 继续特征工程,加强提取特征,AOC值接近89% 阅读全文
posted @ 2015-09-14 10:08 星空守望者--jkmiao 阅读(3598) 评论(10) 推荐(0) 编辑
word2vec剖析,资料整理备存
摘要:word2vec 阅读全文
posted @ 2015-08-12 18:27 星空守望者--jkmiao 阅读(639) 评论(0) 推荐(0) 编辑
朴素贝叶斯分类器的应用
摘要:朴素贝叶斯分类实例:检测SNS社区中不真实账号朴素贝叶斯分类器的公式假设某个体有n项特征(Feature),分别为F1、F2、...、Fn。现有m个类别(Category),分别为C1、C2、...、Cm。贝叶斯分类器就是计算出概率最大的那个分类,也就是求下面这个算式的最大值:P(C|F1F2...... 阅读全文
posted @ 2015-07-21 15:21 星空守望者--jkmiao 阅读(422) 评论(0) 推荐(0) 编辑
机器学习资源大全
摘要:通用机器学习MLlib in Apache Spark—Spark中的分布式机器学习程序库Mahout—分布式的机器学习库Stanford Classifier—斯坦福大学的分类器Weka—Weka是数据挖掘方面的机器学习算法集。ORYX—提供一个简单的大规模实时机器学习/预测分析基础架构。数据分析... 阅读全文
posted @ 2015-05-15 17:12 星空守望者--jkmiao 阅读(416) 评论(0) 推荐(0) 编辑
[转载]Deep Learning(深度学习)学习笔记整理
摘要:转载自:http://blog.csdn.net/zouxy09/article/details/8775360感谢原作者:zouxy09@qq.com八、Deep learning训练过程8.1、传统神经网络的训练方法为什么不能用在深度神经网络 BP算法作为传统训练多层网络的典型算法,实际上对仅含... 阅读全文
posted @ 2015-05-06 21:21 星空守望者--jkmiao 阅读(268) 评论(0) 推荐(0) 编辑
sklearn 线性模型使用入门
摘要:LinearRegressionfits a linear model with coefficientsto minimize the residual sum of squares between the observed responses in the dataset, and the re... 阅读全文
posted @ 2015-04-25 09:32 星空守望者--jkmiao 阅读(730) 评论(0) 推荐(0) 编辑
python 之 决策树分类算法
摘要:发现帮助新手入门机器学习的一篇好文,首先感谢博主!:用Python开始机器学习(2:决策树分类算法)J. Ross Quinlan在1975提出将信息熵的概念引入决策树的构建,这就是鼎鼎大名的ID3算法。后续的C4.5, C5.0, CART等都是该方法的改进。熵就是“无序,混乱”的程度。刚接触这个... 阅读全文
posted @ 2015-04-23 10:06 星空守望者--jkmiao 阅读(6416) 评论(0) 推荐(0) 编辑
协同过滤CF算法之入门
摘要:数据规整首先将评分数据从 ratings.dat 中读出到一个 DataFrame 里:>>>import pandas as pdIn [2]: import pandas as pdIn [3]: df = pd.read_csv('2014-12-18.csv')In [4]: df.head... 阅读全文
posted @ 2015-04-21 11:38 星空守望者--jkmiao 阅读(288) 评论(0) 推荐(0) 编辑
使用k-近邻算法改进约会网站的配对效果
摘要:---恢复内容开始---《 Machine Learning 机器学习实战》的确是一本学习python,掌握数据相关技能的,不可多得的好书!!最近邻算法源码如下,给有需要的入门者学习,大神请绕道。数字识别文件'''Created on Sep 16, 2010kNN: k Nearest Neigh... 阅读全文
posted @ 2015-04-16 11:08 星空守望者--jkmiao 阅读(302) 评论(0) 推荐(0) 编辑
python 读取文本
摘要:将文本转换到NumPy 数组中,做机器学习或其他任何任务,文本处理的技能必不可少。python 实现实现了很精简强大的文本处理功能:假设 文件 traindata.csv 中有数据 1000行,3列特征,第四列(最后一列)为类标签1. 基本方法:def file2matrix(): dataM... 阅读全文
posted @ 2015-04-16 10:53 星空守望者--jkmiao 阅读(533) 评论(0) 推荐(0) 编辑