上一页 1 ··· 4 5 6 7 8 9 下一页
摘要: 阅读全文
posted @ 2013-09-27 08:48 kobeshow 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2013-09-27 08:47 kobeshow 阅读(224) 评论(0) 推荐(1) 编辑
摘要: 【菜鸟读财报,如何从上市公司财报中挖情报?】❶财务数据重点看主营业务收入而不是利润。❷收入、利益要按不同业务类型分别加以分析。❸现金周转情况、折旧情况、年终拥有现金数量等指标同样值得关注。❹纵向、横向比较。❺特殊收益和支出应分析其利弊。 阅读全文
posted @ 2013-09-27 08:44 kobeshow 阅读(320) 评论(0) 推荐(0) 编辑
摘要: 【数据分析注意点】1、要注意每种统计分析方法的适用范围;2、使用不同的数据分析方法对同一问题进行解释,来互相验证结论的真伪,多次尝试;3、结果要使用通俗易懂的语言或图表进行描述;4、需要耐心和细致,不能出现任何疏漏,别一个老鼠害一锅汤;5、高级数据分析不一定是最好的,简单有效才是最好 阅读全文
posted @ 2013-09-27 08:36 kobeshow 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2013-09-26 15:07 kobeshow 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 从这节算是开始进入“正规”的机器学习了吧,之所以“正规”因为它开始要建立价值函数(cost function),接着优化价值函数求出权重,然后测试验证。这整套的流程是机器学习必经环节。今天要学习的话题是逻辑回归,逻辑回归也是一种有监督学习方法(supervised machine learning)。逻辑回归一般用来做预测,也可以用来做分类,预测是某个类别^.^!线性回归想比大家都不陌生了,y=kx+b,给定一堆数据点,拟合出k和b的值就行了,下次给定X时,就可以计算出y,这就是回归。而逻辑回归跟这个有点区别,它是一种非线性函数,拟合功能颇为强大,而且它是连续函数,可以对其求导,这点很重要,. 阅读全文
posted @ 2013-09-26 10:00 kobeshow 阅读(772) 评论(0) 推荐(0) 编辑
摘要: 一数据类型R的数据类型包括数值型、字符型、逻辑型(布尔)、复数型和原生型,同时R有好多存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表,如下图所示下图(图的版权神马的归原作者跟原出版社所有,赶紧避嫌,呵呵)1、向量操作1 a y y 3 [,1] [,2] 4 [1,] 1 6 5 [2,] 2 7 6 [3,] 3 8 7 [4,] 4 9 8 [5,] 5 10 9 > y y11 [,1] [,2]12 [1,] 1 213 [2,] 3 414 [3,] 5 ... 阅读全文
posted @ 2013-09-25 21:26 kobeshow 阅读(641) 评论(0) 推荐(0) 编辑
摘要: 这几年数据挖掘的火热,也越来越多的人把R作为数据挖掘的一个辅助工具,据国际性组织kkguter统计有60%的人在挖掘过程中用到R工具,可见这个工具是多么的流行,对于数据统计、筛选以及画图绝对是神器。尽管之前在学校的时候也“断断续续”的用过它画画图,算算多次实验结果的mean、sd,也用过它来参加过Kaggle上面的比赛,但是都是拿来就用(off-the-shelf),没有系统的记录R的学习过程,借着R in Action一书来温习一下R的艺术编程。 网上有好多关于R的资料,当然官网上的是最全,最系统的,除了官网外,http://tryr.codeschool.com/,http://www.. 阅读全文
posted @ 2013-09-25 12:47 kobeshow 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 贝叶斯决策一直很有争议,今年是贝叶斯250周年,历经沉浮,今天它的应用又开始逐渐活跃,有兴趣的可以看看斯坦福Brad Efron大师对其的反思,两篇文章:“Bayes'Theorem in the 21st Century”和“A250-YEAR ARGUMENT:BELIEF, BEHAVIOR, AND THE BOOTSTRAP”。俺就不参合这事了,下面来看看朴素贝叶斯分类器。 有时我们想知道给定一个样本时,它属于每个类别的概率是多少,即P(Ci|X),Ci表示类别,X表示测试样本,有了概率后我们可以选择最大的概率的类别。要求这个概率要用经典贝叶斯公式,如(公式一)所示:(公式一 阅读全文
posted @ 2013-09-24 19:39 kobeshow 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 决策树也是有监督机器学习方法。 电影《无耻混蛋》里有一幕游戏,在德军小酒馆里有几个人在玩20问题游戏,游戏规则是一个设迷者在纸牌中抽出一个目标(可以是人,也可以是物),而猜谜者可以提问题,设迷者只能回答是或者不是,在几个问题(最多二十个问题)之后,猜谜者通过逐步缩小范围就准确的找到了答案。这就类似于决策树的工作原理。(图一)是一个判断邮件类别的工作方式,可以看出判别方法很简单,基本都是阈值判断,关键是如何构建决策树,也就是如何训练一个决策树。(图一)构建决策树的伪代码如下:Check if every item in the dataset is in the same class: If.. 阅读全文
posted @ 2013-09-24 18:15 kobeshow 阅读(562) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 下一页