数据挖掘(DM)初览
虽然考完了《数据挖掘》,但,要真正问自己到底对 DM 了解到多少,还真的什么都回答不上来!
考试前的几天,才开始看中文版书,说实话,那本英文原版教材看起来真的很吃力,即使你英语水平够高,但你计算机专业水平够高吗?都不高,那就跟看天书是一个概念。
虽然前面的数据预处理以及数据仓库构建十分必要,但是,重要的还是后面的关联规则的挖掘,这其实也很实际,比如应用到实际的电子购物数据分析中,用来发现用户购买喜好,基于此,你也就明白了为什么数据挖掘这个方向的导师也可以顺便把“电子商务”这个方向附加到自己的研究方向上去,去哄一些学生过来(-_______-``` 希望导师别看到这句话!)。
其实,DM 与电子商务的结合只是 Web 数据挖掘的一个分支而已。Web 数据挖掘也只是 DM 众多应用中的一个方向而已。
Web 数据挖掘包含了三个方向:Web 内容挖掘、Web 结构以及 Web 使用记录挖掘。前两者的研究已经出了很多成果,比如 Web 结构挖掘就是各种搜索引擎使用的技术,著名的算法包括 HITS、Google PageRank 等。而 Web 使用记录挖掘方面的研究就相对比较少,也可能是由于电子商务还没有达到成熟的境地。所以说,以后还是要多研究一些 Web 使用记录的数据挖掘,研究人的行为可不是那么好研究的,就如人工智能一样,技术要想达到一定的程度,会受到各种周边技术发展的制约。
对于一些数据挖掘中的算法,我觉得应用还是非常广泛的,并且很实用。就如国外的社会化音乐网站 Last.FM,这网站够COOL,它能通过分析用户听歌的记录,来发觉出你的“音乐DNA”。还有国内的豆瓣,通过你的读书、看电影、听音乐的历史记录来挖掘出你的喜好,给你推荐你可能喜欢的其它书、影、乐。没什么,就是数据挖掘而已。
图书馆看到一本书上说,BI(商业智能)即将成为未来几年 IT 领域的核心价值!呵呵,感觉不错,因为 DM 是 BI 的一个关键。
前景是美好的!欠的,只是静下心,踏踏实实做研究!就这样。