随笔分类 - Data Mining
航空公司客户价值聚类分析
摘要:航空公司客户价值聚类分析 特征工程 K-means聚类 RFM模型 DBSCAN算法 描述 信息时代的来临使得企业营销焦点从产品中心转变成客户中心。具体地,对不同的客户进行分类管理,给予不同类型的客户制定优化的个性化服务方案,采取不同的营销策略。将有限的营销资源集中于高价值的客户,实现企业利润最大化
基于关联规则算法实现电影推荐系统
摘要:基于关联规则算法实现电影推荐系统 利用数据挖掘算法中的Apriori(关联规则)算法来实现一个电影推荐系统 加载数据 数据预处理 生成频繁项集、关联规则 通过关联规则生成电影推荐的列表 Apriori算法 案例: 啤酒与尿布: 沃尔玛超市在分析销售记录时,发现了啤酒与尿布经常一起被购买,于是他们调整
基于PyTorch实现图像去模糊-学习
摘要:基于PyTorch实现图像去模糊-学习 任务描述 相机的抖动、快速运动的物体都会导致拍摄出模糊的图像,景深变化也会使图像进一步模糊。 对于传统方法来说,要想估计出每个像素点对应的 “blur kernel” 几乎是不可行的。因此,传统方法常常需要对模糊源作出假设,将 “blur kernel” 参数
Python数据挖掘——数据预处理
摘要:Python数据挖掘——数据预处理 数据预处理 数据质量 准确性、完整性、一致性、时效性、可信性、可解释性 数据预处理的主要任务 数据清理 数据集成 数据归约 维归约 数值归约 数据变换 规范化 数据离散化 概念分层产生 数据清理(试图填充缺失的值,光滑噪声并识别离群点,纠正数据的不一致) 缺失值
Python数据挖掘——基础知识
摘要:Python数据挖掘——基础知识 数据挖掘又称从数据中 挖掘知识、知识提取、数据/模式分析 即为:从数据中发现知识的过程 1、数据清理 (消除噪声,删除不一致数据) 2、数据集成 (多种数据源 组合在一起) 3、数据选择 (从数据库中提取和分析任务相关的数据) 4、数据变换 (通过汇总或聚焦操作,把