摘要:
这篇中我们将首次接触到最优化算法。 logistics回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这个分类的边界就是我们所求的回归函数。 回归一词源于最佳拟合,表示要找到最佳拟合参数,使用的是最优化算法。回归函数就是确定最佳回归参数,然后对不同的特征赋予不同的权重 阅读全文
摘要:
概率论是许多机器学习算法的基础,因而本篇将会用到一些概率论知识,我们先统计在数据集中取某个特定值的次数,然后除以数据集的实例总数,就得到了取该值的概率。 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对输入数据的准备方式比较敏感 适用于标称型数据 如果P1(X,Y)>P2(X,Y),那 阅读全文
摘要:
上一篇我们介绍的K邻近算法可以解决很多分类的问题,但它的最大的缺点是无法给出数据内在的含义,决策树的主要优势在数据形式非常易于理解。 决策树的构造 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关数据特征。 缺点:可能会产生过度匹配的问题。 适用数据类型:数值型和标称型 阅读全文
摘要:
算法描述 K邻近算法采用测量不同特征值之间的距离方法进行分类 工作原理 存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较 然后算法提取样本集中最相似的数据 阅读全文
摘要:
面向对象与面向过程的区别 所谓的面向对象,其实就是将一个事务拆分成很多个功能,每个功能就是一个对象。就像设计五子棋,规则是一个对象,棋盘是一个对象,而黑白棋又是一个对象。 所谓的面向过程,其实就是将一个事务拆分成几个步骤,每个步骤写个函数,一次调用。还是五子棋,1、开始游戏,2、黑子先走,3、绘制画 阅读全文
摘要:
C#的学习,是配合unity3D而一起学习的,接下来将记录一些学习过程中的心得体会,以及一些笔记。 C#是微软创建的面向对象的,简洁安全的程序语言。以C/C++为语言基础,开发的环境是visual studio,最新版本是C#4.0 C#必须在net.framework上运行,其包括公共语言运行库, 阅读全文
摘要:
面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各自的数据可能不同。 仍以Student类为例,在Python中,定义类是通过class关键字 定义好了Stud 阅读全文
摘要:
首先,python有两个版本,一个是Python2.X,一个是Python3.X,目前Python3.X越来越普及,这两个版本是不兼容的,但由于我所用的大部分学习资料是用Python2.X的语法规则写的,因而我整理的语法规则是基于Python2.X。我整理的部分基本上是我容易遗忘的地方。 数据类型: 阅读全文
摘要:
首先,深度学习网上的资料很多,但大部分都不大适合初学者学习,我个人入门看的是台湾学者李宏毅制作的一个300页PPT --《一天搞懂深度学习》,接下来将对PPT里面的内容进行一些通俗化的描述。另附上该PPT的百度网盘链接:https://pan.baidu.com/s/1b7RVLF8HgqTOE0s 阅读全文