亚北薯条 - 博客园

2020年11月27日

摘要：之前在集成原理小结中总结了Bagging的原理。理解了bagging算法，随机森林(Random Forest,以下简称RF)就好理解了。它是Bagging算法的进化版，也就是说，它的思想仍然是bagging,但是进行了独有的改进。 1. 随机森林的原理（普通bagging的升级版）第一，RF使阅读全文

posted @ 2020-11-27 14:00 亚北薯条阅读(2037) 评论(0) 推荐(0) 编辑

2020年11月26日

【机器学习】决策树原理和调参小结

摘要：决策树（Decision Tree）是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据中总结出决策规则，并用树状图的结构来呈现这些规则，以解决分类和回归问题。决策树算法容易理解，适用各种数据，在解决各种问题时都有良好表现，尤其是以树模型为核心的各种集成算法，比如随机森林，xgboost等阅读全文

posted @ 2020-11-26 19:39 亚北薯条阅读(1246) 评论(0) 推荐(1) 编辑

摘要：本篇主要介绍基于标签的推荐算法，涉及了3个原理较简单的计算方法（Simple Tag-based、Normal Tag-based、Tag-based-Tfidf ），以及python代码实现。 1.概述 1.1 如何定义用户画像用户画像即是对用户行为特征的总结归纳和描述，以更好的提升业务质量。阅读全文

posted @ 2020-11-26 09:24 亚北薯条阅读(5559) 评论(0) 推荐(0) 编辑

2020年11月18日

【机器学习】集成学习中方差和偏差的理解

摘要：一个集成模型(f)在未知数据集(D)上的泛化误差E(f;D)，由方差(var)，偏差(bais)和噪声(ε)共同决定。 \(E(f;D) = var(x) + bais^2(x) + ε^2\) 1. 方差和偏差的基本概念观察下面的图像，每个点就是集成算法中的一个基评估器产生的预测值。红色虚线代表阅读全文

posted @ 2020-11-18 13:45 亚北薯条阅读(757) 评论(0) 推荐(0) 编辑

2020年11月16日

【机器学习】集成学习原理小结 (Bagging , Boosting)

摘要：集成学习(ensemble learning)本身不是一个单独的机器学习算法，它是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成，回归问题集成，特征选取集成，异常点检测集成等等。是近年来非常火爆的机器学习方法。 1.集成学习概述如图是集成学习阅读全文

posted @ 2020-11-16 13:44 亚北薯条阅读(837) 评论(0) 推荐(0) 编辑

2020年11月1日

数据结构与算法—排序（冒泡排序，选择排序，插入排序、希尔排序、快速排序、归并排序）

摘要：排序排序算法（英语：Sorting algorithm）是一种能将一串数据依照特定顺序进行排列的一种算法。排序算法的稳定性稳定性：稳定排序算法会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的，当有两个相等键值的纪录R和S，且在原本的列表中R出现在S之前，在排序过的列表中R也阅读全文

posted @ 2020-11-01 22:48 亚北薯条阅读(272) 评论(0) 推荐(0) 编辑

2020年10月30日

数据结构与算法—二叉树

摘要： 1. 树的概念树（英语：tree）是一种抽象数据类型（ADT）或是实作这种抽象数据类型的数据结构，用来模拟具有树状结构性质的数据集合。它是由n（n>=1）个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。它具有以下的特点：每个节点有阅读全文

posted @ 2020-10-30 11:27 亚北薯条阅读(141) 评论(0) 推荐(0) 编辑

2020年10月28日

数据结构与算法—搜索（二分法）

摘要：搜索搜索是在一个项目集合中找到一个特定项目的算法过程。搜索通常的答案是真的或假的，因为该项目是否存在。搜索的几种常见方法：顺序查找、二分法查找、二叉树查找、哈希查找二分法查找二分查找又称折半查找，优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半阅读全文

posted @ 2020-10-28 11:28 亚北薯条阅读(247) 评论(0) 推荐(0) 编辑

2020年10月25日

数据结构与算法—栈和队列

摘要： 1. 栈栈（stack），有些地方称为堆栈，是一种容器，可存入数据元素、访问元素、删除元素，它的特点在于只能允许在容器的一端（称为栈顶端指标，英语：top）进行加入数据（英语：push）和输出数据（英语：pop）的运算。没有了位置概念，保证任何时候可以访问、删除的元素都是此前最后存入的那个元素，确阅读全文

posted @ 2020-10-25 22:04 亚北薯条阅读(152) 评论(0) 推荐(0) 编辑

数据结构与算法—双向链表

摘要：双向链表一种更复杂的链表是“双向链表”或“双面链表”。每个节点有两个链接：一个指向前一个节点，当此节点为第一个节点时，指向空值；而另一个指向下一个节点，当此节点为最后一个节点时，指向空值。操作 is_empty() 链表是否为空 length() 链表长度 travel() 遍历整个链表 add 阅读全文

posted @ 2020-10-25 19:31 亚北薯条阅读(101) 评论(0) 推荐(0) 编辑