《BI那点儿事》Microsoft 顺序分析和聚类分析算法
Microsoft 顺序分析和聚类分析算法是由 Microsoft SQL Server Analysis Services 提供的一种顺序分析算法。您可以使用该算法来研究包含可通过下面的路径或“顺序”链接到的事件的数据。该算法通过对相同的顺序进行分组或分类来查找最常见的顺序。下面是一些顺序示例:
- 用来说明用户在导航或浏览网站时产生的点击路径的数据。
- 用来说明客户将商品添加到在线零售商的购物车中的顺序的数据。
该算法在许多方面都类似于 Microsoft 聚类分析算法。不过,Microsoft 顺序分析和聚类分析算法不是查找包含类似属性的事例的分类,而是查找顺序中包含类似路径的事例的分类。
示例
Adventure Works Cycles 网站收集有关站点用户访问哪些页面以及页面访问顺序的信息。因为该公司提供在线订购,所以用户必须登录到此站点。这可以为该公司的各个客户配置文件提供点击信息。通过对此数据使用 Microsoft 顺序分析和聚类分析算法,该公司可以查找具有相同的点击模式或点击顺序的客户组或分类。然后,该公司可以使用这些分类来分析用户如何在网站中移动,来识别哪些页面与特定商品的销售关系最密切及预测接下来哪些页面最有可能被访问。
下面我们进入主题,通过简单的过程配置我们来实现整个数据挖掘的过程,依次步骤如下:
参考文献:
Microsoft 顺序分析和聚类分析算法
http://msdn.microsoft.com/zh-cn/library/ms175462(v=sql.105).aspx