摘要: 要完成是这样一个网站:http://www.yushu.im/,该网站主要是赠送书的一个平台(公益性的) 网站框架功能: 网站的搭建 前期准备(用pycharm直接创建应该也可以,感觉直接创简单) 新建文件夹,创建虚拟环境(创建虚拟环境的好处就不说了),安装需要的包。 1)安装pipenv包,pip 阅读全文
posted @ 2019-03-21 19:25 maxiaonong 阅读(7758) 评论(0) 推荐(1) 编辑
摘要: 关于树的基本定义可以百度,简单说一下“树"的特点: 1)每个节点有0个或者多个子节点 2)没有父节点的节点称为根节点 3)每一个非根节点有且只有一个父节点 4)除了根节点外,每一个子节点可以分为多个不相交的子树 树的术语 1)节点的度:一个节点含有子树的个数 2)树的度:一棵树,最大的节点的度 3) 阅读全文
posted @ 2019-03-15 11:10 maxiaonong 阅读(346) 评论(0) 推荐(0) 编辑
摘要: 搜索,顾名思义就是在一个序列中找出某个元素。 二分查找 二分查找只能作用于有序的顺序表中。 二分查找时间复杂度是O(logn) 阅读全文
posted @ 2019-03-14 21:32 maxiaonong 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 排序算法的稳定性: 假设有一串数据:(4,1)(3,1)(3,7)(5,6);要求按照第一个数排序,结果如下: 第一种:(3,1)(3,7)(4,1)(5,6)(3相同,维持原来的次序) 第二种:(3,7)(3,1)(4,1)(5,6)(3相同,次序被改变) 第一种是稳定的。 冒泡排序(以从小到大排 阅读全文
posted @ 2019-03-13 10:44 maxiaonong 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 在此开始记录数据结构与算法(基于Python的)学习,主要参考视频https://www.bilibili.com/video/av21540971/?p=1 线性表 线性表有两种存储结构:顺序存储结构与链式存储结构。 1 顺序表 比如 int 类型的数据1,2,3,4要以顺序表格式存储,首先每个整 阅读全文
posted @ 2019-02-27 17:33 maxiaonong 阅读(414) 评论(0) 推荐(0) 编辑
摘要: 大致看来,我感觉xgboost就是GBDT的改进版,它在原来的基础上加了正则项,也就是优化函数中不仅考虑了误差,还考虑了拟合函数的复杂度。注意这里与GBDT一样,还是用的CRAT树,还是那种串行累加。具体原理与公式推导看这英文版,中文的(写得很好),辅看这个。 阅读全文
posted @ 2018-12-26 16:51 maxiaonong 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 集成学习有两大家族,Bagging家族与Boosting家族;相同家族的算法,思想有类似之处,例如Bagging家族主要并行思想,典型代表:随机森林;Boosting家族主要是串行思想,主要代表有AdaBoost,GBDT. AdaBoost与GBDT虽都是Boosting家族,但是还是有一定的区别 阅读全文
posted @ 2018-12-21 15:43 maxiaonong 阅读(224) 评论(0) 推荐(0) 编辑
摘要: 主要目的:会推导,了解优缺点 主要看这三个链接。1)与李航的书比较接近的。2)公式版 。3)它们当中其实用的损失函数是log损失函数。 阅读全文
posted @ 2018-12-17 21:44 maxiaonong 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 1.二叉树定义特点: 定义:二叉树是n(n>=0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。它是树中的一种。 特点: 1)树中每个节点最多只能有两棵树,即每个节点的度最多为2。(ps;度也就是叶子的概念) 2)二 阅读全文
posted @ 2018-12-03 18:23 maxiaonong 阅读(1991) 评论(0) 推荐(0) 编辑
摘要: 这章主要是非线性回归问题,大致浏览后感觉应该是这样:先将非线性数据用树分段,然后每段取平均值就是树回归,如果每段再线性回归就还是模型树,具体可以参考这里与这里。一般它这个树这里都用CART,不过在sklearn文档中似乎只知道了CART的回归(是回归树),暂时没看到模型树回归。 阅读全文
posted @ 2018-12-03 14:31 maxiaonong 阅读(113) 评论(0) 推荐(0) 编辑