Chen洋

2020年12月13日

摘要：集成学习 Bagging算法： Boosting: Regio Boost: 总结：参考文献：清华大学-数据挖掘：理论与算法（国家级精品课）阅读全文

posted @ 2020-12-13 15:14 Chen洋阅读(98) 评论(0) 推荐(0)

摘要：推荐系统包括两种方式—基于内容的过滤和协同过滤隐含语义分析 Tf-idfTF—出现频率IDF—在其他文档中出现的频率，（在其他文档也经常出现，则IDF值会比较低）向量空间模型相似度—余弦距离存在的问题LSA—隐含语义分析 PageRank L(pj)是指向其他人个数，d是参数，通常设为0.85 阅读全文

posted @ 2020-12-13 14:32 Chen洋阅读(80) 评论(0) 推荐(0)

《数据挖掘：理论与算法》学习笔记（九）—关联规则

摘要：关联规则隐藏在大型数据集中的令人感兴趣的联系例子：关联规则的强度可以用它的支持度和置信度度量支持度与置信度关联规则的支持度支持度是一种重要度量，因为支持度很低的规则可能只是偶然出现，从商务角度来看，低支持度的规则多半也不是令人感兴趣的，因为对顾客很少同时购买的商品进行促销可能并无益处。因此，支阅读全文

posted @ 2020-12-13 13:12 Chen洋阅读(246) 评论(0) 推荐(0)

《数据挖掘：理论与算法》学习笔记（八）—聚类分析

摘要：聚类评估性能 K-Means算法算法步骤下面介绍EM算法思想 DBSCAN：层次聚类：算法思想：课外扩展阅读材料参考文献：清华大学-数据挖掘：理论与算法（国家级精品课）阅读全文

posted @ 2020-12-13 11:33 Chen洋阅读(113) 评论(0) 推荐(0)

《数据挖掘：理论与算法》学习笔记（七）—支持向量机

摘要：支持向量机使用训练集的一个子集来表示决策边界，该子集称作支持向量。线性分类器参考文献：清华大学-数据挖掘：理论与算法（国家级精品课）阅读全文

posted @ 2020-12-13 11:25 Chen洋阅读(109) 评论(0) 推荐(0)

《数据挖掘：理论与算法》学习笔记（六）—神经网络

摘要：感知机—神经网络最基本的模型感知机（perceptron）是二分类的线性分类模型，输入为实例的特征向量，输出为实例的类别（取1和0）。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面.其中，w0 是一个偏差值，这个条件是必要的，如果没有这个条件，切平面会经过原点。我们需阅读全文

posted @ 2020-12-13 11:21 Chen洋阅读(178) 评论(0) 推荐(0)

《数据挖掘：理论与算法》学习笔记（五）—决策树

摘要：决策树模型决策树是一种用于对实例进行分类的树形结构。决策树由节点（node）和有向边（directed edge）组成。节点的类型有两种：内部节点和叶子节点。其中，内部节点表示一个特征或属性的测试条件（用于分开具有不同特性的记录），叶子节点表示一个分类。一旦我们构造了一个决策树模型，以它为基础来阅读全文

posted @ 2020-12-13 11:05 Chen洋阅读(255) 评论(0) 推荐(0)

2020年12月12日

《数据挖掘：理论与算法》学习笔记（四）—贝叶斯分类

摘要：什么是分类分类是一项生存的基本技能，例如，动物对天敌和猎物进行分类。分类是一种有监督的学习，从数据中产生模型，输入一组样本特征后，能很好地将其归为某个类别。（包括二分类和多分类）贝叶斯定理如下所示，用于计算B事件发生的情况下A发生的概率朴素贝叶斯朴素贝叶斯法是基于贝叶斯定理与特征条件独立阅读全文

posted @ 2020-12-12 20:34 Chen洋阅读(155) 评论(0) 推荐(0)

智能计算及其应用--蚁群算法

摘要：参考文献：《人工智能导论》阅读全文

posted @ 2020-12-12 20:22 Chen洋阅读(391) 评论(0) 推荐(0)

智能计算及其应用--粒子群优化算法

摘要：参考文献：《人工智能导论》阅读全文

posted @ 2020-12-12 20:15 Chen洋阅读(227) 评论(0) 推荐(0)

公告