……

随笔分类 -  人工智能之机器学习

python
Python机器学习(三十九)基于数值区间创建数组
摘要:NumPy中,可以通过指定数值范围创建ndarray数组。 numpy.arange 要使用指定区间均匀分布的数值创建数组,可以使用arange函数。 语法如下所示: numpy.arange(start, stop, step, dtype) 参数: start: 区间开始值。默认值是0。 sto 阅读全文
posted @ 2020-06-19 10:14 大码王 阅读(965) 评论(0) 推荐(0) 编辑
Python机器学习(三十八)NumPy 基于已有数据创建数组
摘要:NumPy提供了使用现有数据创建数组的方法。 numpy.asarray 要使用列表或元组创建ndarray数组,可使用asarray函数。这个函数通常用于将python序列转换为numpy数组对象的场景中。 语法如下所示: numpy.asarray(sequence, dtype = None, 阅读全文
posted @ 2020-06-19 10:05 大码王 阅读(421) 评论(0) 推荐(0) 编辑
Python机器学习(三十七)NumPy 数组创建
摘要:要创建ndarray数组对象,除了使用底层的ndarray构造函数(ndarray.array()),还可以使用下面介绍的函数。 numpy.empty empty函数创建未初始化数组,可以指定数组形状和数据类型。 语法如下所示: numpy.empty(shape, dtype = float, 阅读全文
posted @ 2020-06-19 10:00 大码王 阅读(275) 评论(0) 推荐(0) 编辑
Python机器学习(三十六)NumPy 数据类型
摘要:NumPy提供的数值类型,数值范围比Python提供的数值类型更大。NumPy的数值类型,如下表所示: SN数据类型描述 1 bool_ 布尔值,取值ture/false,占用一个字节 2 int_ 是integer的默认类型。与C语言中的long类型相同,有可能是64位或32位。 3 intc 类 阅读全文
posted @ 2020-06-18 18:39 大码王 阅读(354) 评论(0) 推荐(0) 编辑
Python机器学习(三十五)NumPy ndarray
摘要:NumPy中最重要的类是ndarray,ndarray是存储单一数据类型的多维数组。 可以使用索引(从0开始)访问ndarray对象中的元素。 ndarray的内存结构 标准的Python列表(list)中,元素是对象。如:L = [1, 2, 3],需要3个指针和三个整数对象,对于数值运算比较浪费 阅读全文
posted @ 2020-06-18 18:28 大码王 阅读(1272) 评论(0) 推荐(0) 编辑
Python机器学习(三十四)Numpy 介绍
摘要:Numpy代表numeric python,是一个用于计算、处理多维数组的python包。 NumPy包由Travis Oliphant在2005年创建,基于原来的Numeric模块与Numarray模块,大部分是用c语言编写的。 NumPy提供各种强大的数据结构(多维数组和矩阵),以及对这些数据结 阅读全文
posted @ 2020-06-18 18:04 大码王 阅读(331) 评论(0) 推荐(0) 编辑
Python机器学习(三十三)Sklearn 速查
摘要:Scikit-learn是一个开源Python库,它使用统一的接口实现了一系列机器学习、预处理、交叉验证和可视化算法。 一个基本例子 from sklearn import neighbors, datasets, preprocessing from sklearn.model_selection 阅读全文
posted @ 2020-06-18 17:55 大码王 阅读(346) 评论(0) 推荐(0) 编辑
Python机器学习(三十二)Sklearn 支持向量机
摘要:前面章节尝试了K均值聚类模型,准确率并不高。接下来我们尝试一种新方法:支持向量机(SVM)。 支持向量机 支持向量机(support vector machine/SVM),通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸 阅读全文
posted @ 2020-06-18 17:42 大码王 阅读(1072) 评论(0) 推荐(1) 编辑
Python机器学习(三十一)Sklearn K均值聚类
摘要:到目前为止,我们已经非常深入地了解了数据集,并且把它分成了训练子集与测试子集。 接下来,我们将使用聚类方法训练一个模型,然后使用该模型来预测测试子集的标签,最后评估该模型的性能。 聚类(clustering)是在一组未标记的数据中,将相似的数据(点)归到同一个类别中的方法。聚类与分类的最大不同在于分 阅读全文
posted @ 2020-06-18 17:21 大码王 阅读(697) 评论(0) 推荐(0) 编辑
Python机器学习(三十)Sklearn 预处理数据
摘要:前面章节中,我们首先加载数据,接着查看数据集的基本信息,然后可视化数据进一步查看数据集信息。接下来,我们开始处理数据,但这之前,通常需要预处理数据。 数据标准化 大型数据分析项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处 阅读全文
posted @ 2020-06-18 17:18 大码王 阅读(555) 评论(0) 推荐(0) 编辑
Python机器学习(二十九)Sklearn 可视化数据:主成分分析(PCA)
摘要:主成分分析(PCA)是一种常用于减少大数据集维数的降维方法,把大变量集转换为仍包含大变量集中大部分信息的较小变量集。 减少数据集的变量数量,自然是以牺牲精度为代价的,降维的好处是以略低的精度换取简便。因为较小的数据集更易于探索和可视化,并且使机器学习算法更容易和更快地分析数据,而不需处理无关变量。 阅读全文
posted @ 2020-06-18 17:13 大码王 阅读(4721) 评论(0) 推荐(0) 编辑
Python机器学习(二十八)Sklearn 使用matplotlib可视化数据
摘要:digits是一个手写数字的数据集,我们可以使用Python的数据可视化库,比如matplotlib,来查看这些手写数字图像。 示例 显示digits.images中的手写数字图像。 from sklearn import datasets # 加载 `digits` 数据集 digits = da 阅读全文
posted @ 2020-06-18 17:12 大码王 阅读(1401) 评论(0) 推荐(0) 编辑
Python机器学习(二十七)Sklearn 数据集基本信息
摘要:前面章节中,我们加载了SciKit-Learn自带的数据集digits,可以通过以下语句查看数据集中包含哪些主要内容: digits.keys() 输出 dict_keys(['data', 'target', 'target_names', 'images', 'DESCR']) data 样本数 阅读全文
posted @ 2020-06-18 17:08 大码王 阅读(743) 评论(0) 推荐(0) 编辑
Python机器学习(二十六)Sklearn 加载数据集
摘要:机器学习是计算机科学的一个分支,研究的是无需人类干预,能够自己学习的算法。 与TensorFlow不同,Scikit-learn(sklearn)的定位是通用机器学习库,而TensorFlow(tf)的定位主要是深度学习库。 数据科学中的第一步通常都是加载数据,我们首先学习怎么使用SciKit-Le 阅读全文
posted @ 2020-06-18 17:05 大码王 阅读(2527) 评论(0) 推荐(0) 编辑
Python机器学习(二十五)尬聊机器学习
摘要:如果你从来没有使用过机器学习,你会想,这个不就是编程吗?或者,到底机器学习是什么?首先,我们确实是使用编程语言来实现机器学习模型,我们跟计算机其他领域一样,使用同样的编程语言和硬件。但不是每个程序都用了机器学习。对于第二个问题,精确定义机器学习就像定义什么是数学一样难,但我们试图在这章提供一些直观的 阅读全文
posted @ 2020-06-18 15:08 大码王 阅读(342) 评论(0) 推荐(0) 编辑
Python机器学习(二十四)机器学习常见算法分类汇总
摘要:机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家 阅读全文
posted @ 2020-06-18 14:13 大码王 阅读(1424) 评论(1) 推荐(0) 编辑
Python机器学习(二十三)机器学习简史
摘要:自从科学,技术和人工智能的最初立场出发,跟随布莱斯·帕斯卡(Blaise Pascal)和冯·莱布尼兹(Von Leibniz)的科学家们在思考这种机器具有与人类一样多的智力。儒勒·凡尔纳(Jules Verne),弗兰克·鲍姆(Frank Baum,绿野仙踪),玛丽·雪莉(Frankkenstei 阅读全文
posted @ 2020-06-18 14:10 大码王 阅读(312) 评论(0) 推荐(0) 编辑
Python机器学习(二十二)马尔科夫算法
摘要:1. 前言 隐马尔科夫HMM模型是一类重要的机器学习方法,其主要用于序列数据的分析,广泛应用于语音识别、文本翻译、序列预测、中文分词等多个领域。虽然近年来,由于RNN等深度学习方法的发展,HMM模型逐渐变得不怎么流行了,但并不意味着完全退出应用领域,甚至在一些轻量级的任务中仍有应用。本系列博客将详细 阅读全文
posted @ 2020-06-18 11:26 大码王 阅读(326) 评论(0) 推荐(0) 编辑
Python机器学习(二十一)随机森林算法
摘要:一、随机森林算法简介: 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而 "Random Forests" 是他们的商标。 这个术语是1995年由贝尔实验室的Tin 阅读全文
posted @ 2020-06-18 09:50 大码王 阅读(1714) 评论(0) 推荐(0) 编辑
Python机器学习(二十)决策树系列三—CART原理与代码实现
摘要:ID3,C4.5算法缺点 ID3决策树可以有多个分支,但是不能处理特征值为连续的情况。 在ID3中,每次根据“最大信息熵增益”选取当前最佳的特征来分割数据,并按照该特征的所有取值来切分, 也就是说如果一个特征有4种取值,数据将被切分4份,一旦按某特征切分后,该特征在之后的算法执行中, 将不再起作用, 阅读全文
posted @ 2020-06-17 18:56 大码王 阅读(1843) 评论(1) 推荐(0) 编辑

复制代码