摘要:
大家可能听说过,Google 革命性的发明是它名为 “Page Rank” 的网页排名算法,这项技术彻底解决了搜索结果排序的问题。其实最先试图给互联网上的众多网站排序的并不是 Google。Yahoo! 公司最初第一个用目录分类的方式让用户通过互联网检索信息,但由于当时计算机容量和速度的限制,当时的 Yahoo! 和同时代的其它搜索引擎都存在一个共同的问题: 收录的网页太少... 阅读全文
摘要:
0. 缺乏数据(Lack Data)1. 太关注训练(Focus on Training)2. 只依赖一项技术(Rely on One Technique)3. 提错了问题(Ask the Wrong Question)4. 只靠数据来说话(Listen (only) to the Data)5. 使用了未来的信息(Accept Leaks from the Future)6. 抛弃了不该忽略的案... 阅读全文
摘要:
应该如何完整地理解"数据挖掘"?"数据挖掘"的理论基础是什么? 图1表示的是: 现实中人类的社会和经济活动,总可以用数据(数字或者符号)来描述和记录;经过对这些数据的分析,就会产生信息(知识);用这些信息(知识)来指导实践,就可以做出相应的决策;这些决策又引发了新一轮的社会和经济活动。循环往复,生息不止。 那么数据仓库(DW)、商务智能(BI)和知识发现(KDD)又分别是什么呢? 图2中的... 阅读全文
摘要:
数据挖掘是从数据集中识别出有效的、新颖的、潜在并有用的、最终可理解的模式的非平凡过程。它综合使用统计分析、数据仓库、人工智能、信息科学等多个学科的技术,从海量的客户数据中找出传统经营分析方法难以洞察的客户行为模式,给出客户的详细描述,并可以有效预测客户的行为倾向。目前,数据挖掘在电信运营企业中的应用越来越广。但随着应用的深入,偏差和误区也频繁出现,包括操作、流程、思路、方法、工具等。笔者试图从经典... 阅读全文
摘要:
什么样是人性化的服务? 想听一首歌,不必想好其歌名,到搜索引擎里去搜索、下载;而是输入现在的心情,比如“激昂”,播放器就自动播放出《男儿当自强》这样的歌曲,而且一首接着一首。 想去旅游,不必苦思要去什么具体的城市,而是输入大概想法,比如“浪漫的周末度假”,就能马上看到十个建议:包括一家临海宾馆的情侣房、烛光晚餐、一套在周五晚起飞周日晚返归... 阅读全文