SQL SERVER 数据挖掘中的几个问题(四):如何实现Web 路径流挖掘

最近与一个客户的开发团队探讨和学习SQL Server的数据挖掘及其应用。有几个比较有意思的问题,整理出来

关于数据挖掘的基本知识和学习资料,可以参考http://msdn.microsoft.com/zh-cn/library/bb510517.aspx

 

上一篇:SQL SERVER 数据挖掘中的几个问题(三):理解聚类算法和顺序聚类算法

 

上一篇解释了聚类算法和顺序聚类算法,这一篇讲解一个实例,就是我们常说的Web 路径流挖掘分析。Web路径流是让我们发现用户使用网站的习惯的一种表示方式,例如我们想知道用户是先到什么页面,然后再到什么页面,由此我们可以给用户分组,并且根据他们的习惯定制更好的页面导航设计。

按照数据挖掘的基本流程,我们一步一步来做

 

1.定义问题:通过分析得到不同用户群使用网站的路径及其规律

2.准备数据:

为此,我们准备两个表格,分别保存客户信息(如下)

image

以及客户点击页面的记录表(这里作为演示,我只填写了一些范例数据)

image

3.建立模型:

准备数据源和数据源视图

image

创建挖掘模型。这个业务场景,我们适合用“顺序分析和聚类分析”

image

image

image

image

image

image

image

点击“Finish”之后,检查模型的设计

image

image

4.部署和处理

image

image

image

【备注】因为数据不多,所以看到的结果比较简单。有兴趣的朋友可以实际准备一些数据进行分析

posted @   陈希章  阅读(2998)  评论(7编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
历史上的今天:
2009-07-24 .NET : 如何将16进制颜色代码转换为十进制
点击右上角即可分享
微信分享提示