Fork me on GitHub
摘要: 数据结构中的树的结点和机器学习中决策树的结点有一个很大的不同就是,数据结构中的树的每个叶结点都是独立的。 树的高度(Height)指叶结点的最大层树(不包含根结点) 一、树的建立 树可以这样定义:一棵树由一系列结点和一系列连接结点的边组成 树也可以这样定义: 一棵树有根和其他子树组成,这些子树也是树 阅读全文
posted @ 2018-05-09 20:53 Byron_NG 阅读(19327) 评论(0) 推荐(1) 编辑
摘要: 魔术方法总是被 包围, 如 , 都是常见的魔术方法,这里主要写一下我遇到的一些魔术方法 __setitem__ 即可以进行赋值操作,如 在上述代码的情况下,可以执行 操作,即将key赋给k,value赋给v,执行put(k, v)函数。所以, 建立的前提,是要这个函数内的操作本来具有赋值的性质。 _ 阅读全文
posted @ 2018-05-09 11:07 Byron_NG 阅读(262) 评论(0) 推荐(0) 编辑
摘要: 在具体算法之前,首先来看一下排序算法衡量的标准: 1. 比较:比较两个数的大小的次数所花费的时间。 2. 交换:当发现某个数不在适当的位置时,将其交换到合适位置花费的时间。 冒泡排序(Bubble Sort) 这是一个面试经常考的排序,虽然简单,但是要保证一点都不出错也不简单。 冒泡,顾名思义,每一 阅读全文
posted @ 2018-05-03 12:31 Byron_NG 阅读(1399) 评论(0) 推荐(0) 编辑
摘要: 通常,在Data Science中,预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用 "sklearn文档" 中的一些东西来说明,主要把各个标准化方法的应用场景以及优缺点总结概括,以来充当笔记。 首先,我要引用我自己的文章[Feature Preprocessing on Kaggle ] 阅读全文
posted @ 2018-05-01 19:26 Byron_NG 阅读(51502) 评论(0) 推荐(7) 编辑
摘要: Search是数据结构中最基础的应用之一了,在python中,search有一个非常简单的方法如下: False 不过这只是search的一种形式,下面列出多种形式的search用做记录: 一、顺序搜索 顺着list中的元素一个个找,找到了返回True,没找到返回False False True 二 阅读全文
posted @ 2018-05-01 14:13 Byron_NG 阅读(1817) 评论(0) 推荐(0) 编辑
摘要: 更新至2018.5.31 字典生成DataFrame 今天一个字典生成一个DataFrame,采用了以下形式,每一个value都是一个数(不是vector) 结果爆出了如下错误 原来所以,将字典生成DataFrame,您可以用 ,当然也不一定非要这样,所以三种方法是可以成功的: 引自: "统计师的P 阅读全文
posted @ 2018-05-01 10:46 Byron_NG 阅读(1221) 评论(0) 推荐(0) 编辑
摘要: 原文: "数据太大爆内存怎么办?七条解决思路 | 机器学习开发手册" 在研究、应用机器学习算法的经历中,相信大伙儿经常遇到数据集太大、内存不够用的情况。 这引出一系列问题: 怎么加载十几、几十 GB 的数据文件? 运行数据集的时候算法崩溃了,怎么办? 怎么处理内存不足导致的错误? 本文将讨论一些常用 阅读全文
posted @ 2018-05-01 00:01 Byron_NG 阅读(2326) 评论(0) 推荐(0) 编辑
摘要: turtle Python自带了一个turtle库,就像名字turtle说的那样,你可以创建一个turtle,然后这个turtle可以前进,后退,左转,这个turtle有一条尾巴,能够放下和抬起,当尾巴放下的时候,turtle走过的地方就留下了痕迹,也就是这只画笔的原理。 下面的表格是基本的一些tu 阅读全文
posted @ 2018-04-30 17:18 Byron_NG 阅读(832) 评论(0) 推荐(0) 编辑
摘要: groupby官方解释 DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs) Group series using mapp 阅读全文
posted @ 2018-04-28 21:10 Byron_NG 阅读(56520) 评论(3) 推荐(4) 编辑
摘要: linked list(链表) 建立 Node 链表的基本组成就是一个个Node,每个Node都需要包括两部分内容,一部分是自身的data,另一部分是下一个Node的reference。 class Node: def __init__(self, init_data): self.data = i 阅读全文
posted @ 2018-04-27 23:12 Byron_NG 阅读(484) 评论(0) 推荐(0) 编辑
摘要: Reference: Problem Solving with Algorithms and Data Structures, Release 3.0 队列 Queue 建立 class Queue: def __init__(self): self.items = [] def is_empty( 阅读全文
posted @ 2018-04-26 17:16 Byron_NG 阅读(1236) 评论(0) 推荐(0) 编辑
摘要: 刚入手data science, 想着自己玩一玩kaggle,玩了新手Titanic和House Price的 项目, 觉得基本的baseline还是可以写出来,但是具体到一些细节,以至于到能拿到的出手的成绩还是需要理论分析的。 本文旨在介绍kaggle比赛到各种原理与技巧,当然一切源自于cours 阅读全文
posted @ 2018-04-26 09:51 Byron_NG 阅读(1850) 评论(0) 推荐(0) 编辑
摘要: Reference: Problem Solving with Algorithms and Data Structures, Release 3.0 自学一下数据结构,学完之后刷leetcode,使用python,从stack开始 Stack建立 以上stack的top位置位于list的endin 阅读全文
posted @ 2018-04-25 20:29 Byron_NG 阅读(3094) 评论(0) 推荐(0) 编辑
摘要: Regular expressions are a powerful language for matching text patterns. This page gives a basic introduction to regular expressions themselves suffici 阅读全文
posted @ 2018-03-18 15:12 Byron_NG 阅读(873) 评论(0) 推荐(0) 编辑
摘要: 用PCA(主成分分析法)进行信号滤波 此文章从我之前的CSDN上导入,代码什么的可以参考matlab官方帮助文档 现在网上大多是通过PCA对数据进行降维,其实PCA还有一个用处就是可以进行信号滤波。网上对此的介绍比较少,正好最近研究了一下,所以把自己的理解记录下来。 对于PCA原理的介绍网上已经有很 阅读全文
posted @ 2016-10-21 16:34 Byron_NG 阅读(4837) 评论(5) 推荐(0) 编辑