摘要:
NumPy提供的数值类型,数值范围比Python提供的数值类型更大。NumPy的数值类型,如下表所示: SN数据类型描述 1 bool_ 布尔值,取值ture/false,占用一个字节 2 int_ 是integer的默认类型。与C语言中的long类型相同,有可能是64位或32位。 3 intc 类 阅读全文
摘要:
NumPy中最重要的类是ndarray,ndarray是存储单一数据类型的多维数组。 可以使用索引(从0开始)访问ndarray对象中的元素。 ndarray的内存结构 标准的Python列表(list)中,元素是对象。如:L = [1, 2, 3],需要3个指针和三个整数对象,对于数值运算比较浪费 阅读全文
摘要:
Numpy代表numeric python,是一个用于计算、处理多维数组的python包。 NumPy包由Travis Oliphant在2005年创建,基于原来的Numeric模块与Numarray模块,大部分是用c语言编写的。 NumPy提供各种强大的数据结构(多维数组和矩阵),以及对这些数据结 阅读全文
摘要:
Scikit-learn是一个开源Python库,它使用统一的接口实现了一系列机器学习、预处理、交叉验证和可视化算法。 一个基本例子 from sklearn import neighbors, datasets, preprocessing from sklearn.model_selection 阅读全文
摘要:
前面章节尝试了K均值聚类模型,准确率并不高。接下来我们尝试一种新方法:支持向量机(SVM)。 支持向量机 支持向量机(support vector machine/SVM),通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸 阅读全文
摘要:
到目前为止,我们已经非常深入地了解了数据集,并且把它分成了训练子集与测试子集。 接下来,我们将使用聚类方法训练一个模型,然后使用该模型来预测测试子集的标签,最后评估该模型的性能。 聚类(clustering)是在一组未标记的数据中,将相似的数据(点)归到同一个类别中的方法。聚类与分类的最大不同在于分 阅读全文
摘要:
前面章节中,我们首先加载数据,接着查看数据集的基本信息,然后可视化数据进一步查看数据集信息。接下来,我们开始处理数据,但这之前,通常需要预处理数据。 数据标准化 大型数据分析项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处 阅读全文
摘要:
主成分分析(PCA)是一种常用于减少大数据集维数的降维方法,把大变量集转换为仍包含大变量集中大部分信息的较小变量集。 减少数据集的变量数量,自然是以牺牲精度为代价的,降维的好处是以略低的精度换取简便。因为较小的数据集更易于探索和可视化,并且使机器学习算法更容易和更快地分析数据,而不需处理无关变量。 阅读全文
摘要:
digits是一个手写数字的数据集,我们可以使用Python的数据可视化库,比如matplotlib,来查看这些手写数字图像。 示例 显示digits.images中的手写数字图像。 from sklearn import datasets # 加载 `digits` 数据集 digits = da 阅读全文
摘要:
前面章节中,我们加载了SciKit-Learn自带的数据集digits,可以通过以下语句查看数据集中包含哪些主要内容: digits.keys() 输出 dict_keys(['data', 'target', 'target_names', 'images', 'DESCR']) data 样本数 阅读全文
摘要:
机器学习是计算机科学的一个分支,研究的是无需人类干预,能够自己学习的算法。 与TensorFlow不同,Scikit-learn(sklearn)的定位是通用机器学习库,而TensorFlow(tf)的定位主要是深度学习库。 数据科学中的第一步通常都是加载数据,我们首先学习怎么使用SciKit-Le 阅读全文
摘要:
如果你从来没有使用过机器学习,你会想,这个不就是编程吗?或者,到底机器学习是什么?首先,我们确实是使用编程语言来实现机器学习模型,我们跟计算机其他领域一样,使用同样的编程语言和硬件。但不是每个程序都用了机器学习。对于第二个问题,精确定义机器学习就像定义什么是数学一样难,但我们试图在这章提供一些直观的 阅读全文
摘要:
近年来,随着科技的快速发展,人工智能不断进入我们的视野中。作为人工智能的核心技术,机器学习和深度学习也变得越来越火。一时间,它们几乎成为了每个人都在谈论的话题。那么,机器学习和深度学习到底是什么,它们之间究竟有什么不同呢? 什么是机器学习? 机器学习(Machine Learning,ML)是人工智 阅读全文
摘要:
人工智能的浪潮正席卷全球,诸多词汇时刻萦绕在我们的耳边,如人工智能,机器学习,深度学习等。“人工智能”的概念早在1956年就被提出,顾名思义用计算机来构造复杂的,拥有与人类智慧同样本质特性的机器。经过几十年的发展,在2012年后,得益于数据量的上涨,运算力的提升和机器学习算法(深度学习)的出现,人工 阅读全文
摘要:
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家 阅读全文
摘要:
自从科学,技术和人工智能的最初立场出发,跟随布莱斯·帕斯卡(Blaise Pascal)和冯·莱布尼兹(Von Leibniz)的科学家们在思考这种机器具有与人类一样多的智力。儒勒·凡尔纳(Jules Verne),弗兰克·鲍姆(Frank Baum,绿野仙踪),玛丽·雪莉(Frankkenstei 阅读全文
摘要:
一、随机森林算法简介: 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而 "Random Forests" 是他们的商标。 这个术语是1995年由贝尔实验室的Tin 阅读全文