摘要:
背景介绍 时间序列:一组对于某一变量连续时段上的观测值。 模式识别主要涉及到两个方向:一个是复杂统计,另一个是机器学习。复杂统计是将数据拟合到已知的古典模型中,比如ARMA。而机器学习会用深度学习-神经网络,进行暴力拟合。本文主要讲述复杂统计中的AR、MA、ARMA、ARIMA四种经典模型。深度学习 阅读全文
摘要:
一、推荐算法 当你在电商网站购物时,天猫会弹出“和你买了同样物品的人还买了XXX”的信息;当你在SNS社交网站闲逛时,也会看到“你可能认识XXX“的信息;当你在微博添加关注人时,也会看到“你可能对XXX也感兴趣”等等。所有这一切,都是背后的推荐算法运作的结果。 推荐算法,不是某一个也不是某一类算法, 阅读全文
摘要:
一、概念 关联算法常用于购物篮分析:找到正向、强关联的商品集合,用来优化货架商品摆放和捆绑销售。 关联算法需要明确:频繁项集(A,B),A->B和B->A的关联方向(正、负)与关联程度(强、弱)。 频繁项集:出现次数不小于设定阀值的商品集合 电商常用单品推荐单品,称为频繁2项集,形如(A,B)。 关 阅读全文
摘要:
逻辑回归由于其简单、高效、可解释性强的特点,在实际用途中十分的广泛:从购物预测到用户营销响应,从流失分析到信用评价,都能看到其活跃的身影。可以说逻辑回归占据了分类算法中非常重要的地位。 逻辑回归:logistic regression,LR。模型公式是Logistic函数,也叫Sigmoid函数。图 阅读全文
摘要:
单变量的线性回归非常容易理解,就是生成一元一次方程: y=ax+b。x表示自变量,特征属性的值;y表示因变量,预测标签的值。 二维图像更直观:x是横坐标,y是纵坐标,a是斜率,b是与纵坐标的截距。 样本的坐标点有限,也不会都在一条直线上。如何拟合一条合理的直线,本文会详细解析。 看懂一元一次方程的推 阅读全文