顶尖数据挖掘教学案例库(TipDM-C10)产品白皮书

 

 

 

顶尖数据挖掘教学案例库

(TipDM-C10)

 

 

 

 

 

产  品  说  明  书

广州泰迪智能科技有限公司 版权所有

地址: 广州市经济技术开发区科学城232号

网址: http://www.tipdm.com

邮箱: services@tipdm.com

热线: 40068-40020

企业QQ:40068-40020

邮编: 510663

电话: (020)82039399

 

目  录

1                     概述............................................................................................................... 3

2                     产品构成........................................................................................................ 5

2.1             案例技术方案书.......................................................................................... 5

2.2             配套数据文件.............................................................................................. 5

2.3             配套用例程序.............................................................................................. 6

3                     联系我们........................................................................................................ 8

 

 

1   概述

顶尖数据挖掘教学案例库(又称10个精选数据挖掘案例及实践演练,TipDM-C10,简称C10)是泰迪科技在数据挖掘领域探索10余年和高校资深讲师联合经验总结之作,内容涵盖电信、电力、制造、互联网、银行、水产、税务等诸多行业,特别适合有数据挖掘相关课程教学的高校、研究所和培训机构,也可作为个人学习数据挖掘技术的最佳素材。

10个精选数据挖掘案例包括为:

1)   电力窃漏电用户自动识别

案例描述:通过采集电力计量自动化系统的电流、电压、功率因数等用电负荷数据,用电异常等终端报警信息以及电力营销系统提供的历史窃漏电用例,归纳出窃漏电用户的关键特征,构建出窃漏电用户的识别模型,最终通过监测用户用电数据,实现窃漏电用户的实时在线诊断。

实践演练环境:MATLAB、SAS、SPSS、R

2)   航空公司客户价值分析

案例描述:激烈的市场竞争,各个航空公司都推出了更优惠的营销方式来吸引更多的客户,国内航空公司大多都面临着常旅客流失、竞争力下降、航空资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略,对不同的客户群提供个性化的客户服务。

实践演练环境:MATLAB、SAS、SPSS、R

3)   中医证型的关联规则挖掘

案例描述:借助三阴乳腺癌患者的病理信息,发现中医症状间的关联关系和诸多症状间的规律性,挖掘潜性证素,并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。这样患者在治疗过程中,医生可以有效的减少西医以及化疗治疗的毒副作用,为后续治疗打下基础。

实践演练环境:MATLAB、SAS、SPSS、R

4)   基于水色图像的水质评价

案例描述:由于水色能反映水中浮游植物的种类和多少,因此可通过观察水色变化来调控水质,维持养殖水体生态系统中浮游植物、微生物类、浮游动物等合理的动态平衡。通过历史水产专家经验判断结果以及用数码相机按照标准进行水色采集的数据,利用图像处理技术,实现基于水色图像的水质自动评价。

实践演练环境:MATLAB、SAS、SPSS、R

5)   应用系统负载分析与磁盘容量预测

案例描述:与应用系统关联的任何一种资源负载过大,都可能会引起系统性能下降甚至瘫痪。通过分析磁盘容量相关数据,预测应用系统服务器磁盘空间是否满足系统健康运行的要求。根据用户需求设置不同的预警等级,将预测值与容量值进行比较,对其结果进行预警判断,为系统管理员提供定制化的预警提示。

实践演练环境:MATLAB、SAS、SPSS、R

6)   面向网络舆情的关联度分析

案例描述:网络舆情对政治生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。通过从社区网站上采集到网络舆情信息和分析对象信息,建立分析对象与舆情资源之间关联度的计算规则,寻找出与给定舆情资源联系最紧密的分析对象。

实践演练环境:MATLAB、SAS、SPSS、R

7)   家用电器用户行为分析及事件识别

案例描述:家用电器在使用过程中,因地区气候、区域不同、用户年龄性别差异,形成不同的机组使用行为,称之为用户的使用习惯。根据用户使用热水器的使用行为构建出洗浴事件识别模型,进而深入了解热水器在用户所在区域的真实使用习惯,优化新产品的设计和布局营销。

实践演练环境:MATLAB、SAS、SPSS、R

8)   基于基站定位数据的商圈分析

案例描述:商圈是现代市场中企业市场活动的空间,也是商品和服务享用者的区域。商圈划分的目的之一是为了研究潜在的顾客的分布以制定适宜的商业对策。从通信运营商提供的基站定位数据,利用基站小区的覆盖范围作为商圈区域的划分,归纳出商圈的人流特征和规律,识别出不同类别的商圈,实现营销指导。

实践演练环境:MATLAB、SAS、SPSS、R

9)   气象与电力输电线路缺陷关联分析

案例描述:由于输电线路的组成部件大都暴露在外,极端恶劣的气候对输电线路造成非常大的危害。通过分析鸟害、接地装置受损、保护区安全隐患、部件发热异常、锈蚀损伤等缺陷与气象因子的关联关系,构建出气象因子与缺陷关联关系的预警模型。实现在极端气象条件下缺陷在高发区发生的概率并进行预警。

实践演练环境:MATLAB、SAS、SPSS、R

10)  基于关联规则的电子商务智能推荐服务

案例描述:根据电子商务网站采集到的用户访问数据,对用户的访问内容作关联规则分析,探寻用户访问网站的业务逻辑关系,为用户推荐精确的知识内容与服务,从而建立稳定的网站忠实顾客群,实现客户链式反应增值,为企业实现更为人性化的客户定位,提高消费者满意度。

实践演练环境:MATLAB、SAS、SPSS、R

更多项目案例详见:www.tipdm.org

 

2     案例产品构成

  1. 1.       
  2. 2.       
  3. 3.       

3.1.       

2.1  案例技术方案书

案例技术说明书经泰迪科技和多所高校教师联合整理提炼而成,深入浅出的介绍了一个数据挖掘应用从提出需求到最后实现的整个过程,案例技术书按如下结构组织材料:

1、背景与挖掘目标

2、分析方法与过程

1)数据抽取

2)数据探索

3)数据预处理

4)模型构建

5)模型评价

6)模型应用

3、上机实验

4、拓展思考

示例:

 

2.2  配套数据文件

配套数据文件主要包括源文件、过程文件及结果文件等,分别存放在示例程序、上机实验、上机实验拓展及拓展思考等文件夹。

 

以下为示例程序中的数据文件:

 

以下为上机实验中的数据文件:

 

2.3  配套用例程序

用例程序主要包括案例过程示例程序、上机实验程序(MATLAB环境)、上机实验拓展程序(SPSS、SAS和R语言)。

以下为示例程序中的MATLAB程序:

 

 

以下为上机实验中的MATLAB程序:

 

以下为上机实验拓展中的SAS程序:

 

 

以下为上机实验拓展中的SPSS模型:

 

 


3     联系我们

感谢您选择广州泰迪科技公司的数据挖掘产品,在系统的使用过程中如果遇到问题,请通过如下的方式与我们联系,我们将为用户提供周到满意的服务。

主页http://www.tipdm.com

电话:020-82039399

传真:020-28871586

热线:40068-40020

地址:广州经济技术开发区科学城科珠路232号

邮编:510663

邮箱:services@tipdm.com

 

posted @ 2015-04-10 09:28  刘名军  阅读(951)  评论(2编辑  收藏  举报