摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12870414.html K-Means K-Means 是一种无监督学习,解决的是聚类问题。K 代表的是 K 类,Means 代表的是中心,这个算法的本质是确定 K 类的中心点,当找到了这些中心点,也就 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12855528.html 特征缩放 归一化 将一列数据变化到某个固定区间(范围)中,通常这个区间是[0, 1] 标准化 将数据变换为均值为0,标准差为1的分布 Rescaling (min-max nor 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12844059.html PCA 主成分分析利用正交变换将可能存在相关性的原始属性转换成一组线性无关的新属性,并通过选择重要的新属性实现降维。 为什么降维 在机器学习中 数据被表示为向量 当数据的维度很小 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12832908.html 过程划分 基于分词的数据准备,包括分词、单词权重计算、去掉停用词; 应用朴素贝叶斯分类进行分类,首先通过训练集得到朴素贝叶斯分类器,然后将分类器应用于测试集,并与实际结果做对比, 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12828493.html 什么是 TF-IDF 值 在多项式朴素贝叶斯中提到了“词的 TF-IDF 值”,TF-IDF 是一个统计方法,用来评估某个词语对于一个文件集或文档库中的其中一份文件的重要程度。 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12817568.html Naive Bayes 朴素贝叶斯( Naive Bayes )是一种 基于概率 统计的分类方法。它在 条件独立 这个假设的基础上,使用 贝叶斯定理 构建算法。 概念引入 条件概 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12812686.html List @Test public void listInitTest() { List<Integer> list = Stream.of(1, 2, 3, 4, 5, 6). 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12812560.html filter @Test public void filterTest() { List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12811475.html Definition A short definition is a sequence of elements from a source that supports data 阅读全文
摘要:
原创转载请注明出处:https://www.cnblogs.com/agilestyle/p/12807844.html Examples of lambdas and method reference equivalents There are three main kinds of method 阅读全文