随笔分类 - 机器学习
摘要:一. 量化投资的主要内容 量化选股 : 选公司股票 量化择时: 涨则抛,跌则停 套利交易: 算法交易 资产配置: 找到最好的市场资产组合,找最大收益 风险控制: VAR 模型衡量风险 预测模型: 时间序列预测股价, 支持向量机预测,神经网络预测模型. 二. 时间序列模型 平稳时间序列模型 1. 白噪
阅读全文
摘要:北美IT公司大致分档(from mitbbs.com)第一档: Uber, Snapchat, Airbnb, Dropbox, Pinterest第二档:Facebook, LinkedIn, Google, Twitter, Apple第三档: Square, Yelp, Netflix, Sk...
阅读全文
摘要:1. 你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法? 答:推荐中用过CF,LR 分类中用过SVM,GBDT; 一般用法是什么,是不是自己实现的,有什么比较知名的实现,使用过程中踩过哪些坑; 优缺点分析。 2.你熟悉的机器学习/数据挖掘算法主要有哪些? 基础算法要多说,其它算法要挑熟悉程度高的说,不光列举算法,也适当说说应用场合; 答:协同过滤,聚类,分类, 3. ...
阅读全文
摘要:0.支持度与置信度《mahout实战》与《机器学习实战》一起该买的记录数占所有商品记录总数的比例——支持度(整体)买了《mahout实战》与《机器学习实战》一起该买的记录数占所有购买《mahout实战》记录数的比例——置信度(局部)支持度、置信度越大,商品出现一起购买的次数就越多,可信度就越大。支持...
阅读全文
摘要:假设集合A={a, b},集合B={0, 1, 2},则两个集合的笛卡尔积为{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}。
阅读全文
摘要:各位工程师累了吗? 推荐一篇可以让你技术能力达到出神入化的网站["宅男门诊"](https://zhainanmenzhen.com/) 1、使用机器学习来解决问题,我们用数学语言来描述它,然后建立一个模型,例如回归模型或者分类模型等来描述这个问题; 2、通过最小化误差、最大似然、最大后验概率等等建
阅读全文
摘要:1. 如果有一个新的面积,假设在销售价钱的记录中没有的,而我们又想知道房屋的售卖价格,我们怎么办呢?图中绿色的点就是我们想要预测的点。 假设我们知道了红色的这条直线,那么给出房屋的面积,马上就可以给出房屋的售价。因此,我们需要找到这样的一条红色直线。 2.模型建立 刚才我们认为房屋的售价只与面积相关。实际生活中,影响房价的因素非常多,如房屋的面积、朝向、所在小区、房间的个数等。考虑更多的情况,...
阅读全文
摘要:(手机的颜色,大小,用户体验来加权统计总体的值)极大似然估计MLE 1.Logistic回归 Logistic regression (逻辑回归),是一种分类方法,用于二分类问题(即输出只有两种)。如用于广告预测,也就是根据某广告被用户点击的可能性,把最可能被用户点击的广告摆在用户能看到的地方,结果是用户要么点击要么不点击。 通常两类使用类别标号0和1表示,0表示不发生,1表示发生。 问题引...
阅读全文
摘要:1. 1、问题的引入 2、一个实例 3、基本概念 4、ID3 5、C4.5 6、CART 7、随机森林 2. 我们应该设计什么的算法,使得计算机对贷款申请人员的申请信息自动进行分类,以决定能否贷款? 一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话: 女儿:多大年纪了? 母亲:26。 女儿:长的帅不帅? 母亲:挺帅的。 女儿:收入高不? 母亲:不算很高,中等情况。 女儿:是公...
阅读全文
摘要:mahout 与spark 的一个库结合
阅读全文
摘要:1、简单例子引入 2、先验概率 3、后验概率 4、最小错误率决策 5、最小风险贝叶斯决策 1. 贝叶斯公式 2简单例子 正常情况下,我们可以快速的将街上的人分成男和女两类。这里街上的人就是我们观测到的样本,将每一个人分成男、女两类就是我们做决策的过程。上面的问题就是一个分类问题。 分类可以看作是一种决策,即我们根据观测对样本做出应归属哪一类的决策。 假定我手里...
阅读全文
摘要:1.对角矩阵 不在主对角线上的元素全部为0的n阶方阵,称为对角矩阵.2.分块矩阵的对角阵
阅读全文
摘要:1.找出一个附近的点来判断是不是极值点.迭代求(求最小值)(梯度下降法) 2.如果求最大值则改为正号. (梯度上升法)3.随机梯度下降法:一次处理一个样本值4.批处理梯度下降法:一次处理m个样本值
阅读全文
摘要:协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组成一个排序的目录作为推荐给你.核心问题:1,如何确定一个用户是不是和你有相似品位?2.如何将邻居们的喜好组织成一个排序的目录?步骤:1.收集用户偏好 评分,投票,转发,保存书签...
阅读全文
摘要:奥卡姆剃刀定律(Occam's Razor, Ockham'sRazor)又称“奥康的剃刀”,是由14世纪逻辑学家、圣方济各会修士奥卡姆的威廉(William of Occam,约1285年至1349年)提出。这个原理称为“如无必要,勿增实体”,即“简单有效原理”。
阅读全文
摘要:欠拟合:对样本预测得不好,对新数据预测不好过拟合:对样本预测好,对新数据预测不好.
阅读全文
摘要:1.如果一味追求提高对训练数据的预测能力,所选模型的复杂度则往往会比真模型更高,这种现象称为过拟合(over-fitting ). 2.过拟合是指学习时选择的模型所包含的参数过多,以致于出现这一模型对已知数据预测得很好,但对未知数据预测很差的现象.3.可以说模型选择旨在避免过拟合并提高模型的预测能力...
阅读全文