摘要:
做机器学习的一定对支持向量机(support vector machine-SVM)颇为熟悉,因为在深度学习出现之前,SVM一直霸占着机器学习老大哥的位子。他的理论很优美,各种变种改进版本也很多,比如latent-SVM, structural-SVM等。这节先来看看SVM的理论吧,在(图一)中A图表示有两类的数据集,图B,C,D都提供了一个线性分类器来对数据进行分类?但是哪个效果好一些?(图一) 可能对这个数据集来说,三个的分类器都一样足够好了吧,但是其实不然,这个只是训练集,现实测试的样本分布可能会比较散一些,各种可能都有,为了应对这种情况,我们要做的就是尽可能的使得线性分类器离两... 阅读全文
摘要:
本章是上一章邮件过滤技术的延伸,上一章的内容主要是过滤掉垃圾邮件,而这里要讲的是对那些正常的邮件是否可以加入个性化元素,由于每个用户关心的主题并非一样(有人喜欢技术类型的邮件或者购物促销方便的内容邮件等)。如何把邮件按照用户的关注程度分类,把重要邮件优先让用户浏览, 无疑会大大的增加用户的体验。 Tapestry作为最早的个性化邮箱,它通过分析用户阅读邮件的行为习惯对邮件进行排序,提供个性化服务。这个想结合最近的做的项目(游戏推荐)一起讲,跳过这一章看机器学习里面的回归问题。 阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:
【菜鸟读财报,如何从上市公司财报中挖情报?】❶财务数据重点看主营业务收入而不是利润。❷收入、利益要按不同业务类型分别加以分析。❸现金周转情况、折旧情况、年终拥有现金数量等指标同样值得关注。❹纵向、横向比较。❺特殊收益和支出应分析其利弊。 阅读全文
摘要:
【数据分析注意点】1、要注意每种统计分析方法的适用范围;2、使用不同的数据分析方法对同一问题进行解释,来互相验证结论的真伪,多次尝试;3、结果要使用通俗易懂的语言或图表进行描述;4、需要耐心和细致,不能出现任何疏漏,别一个老鼠害一锅汤;5、高级数据分析不一定是最好的,简单有效才是最好 阅读全文