关闭页面特效

随笔分类 - 人工智能之机器学习

python

摘要：NumPy中，可以通过指定数值范围创建ndarray数组。 numpy.arange 要使用指定区间均匀分布的数值创建数组，可以使用arange函数。语法如下所示： numpy.arange(start, stop, step, dtype) 参数： start: 区间开始值。默认值是0。 sto 阅读全文

posted @ 2020-06-19 10:14 大码王阅读(978) 评论(0) 推荐(0) 编辑

Python机器学习（三十八）NumPy 基于已有数据创建数组

摘要：NumPy提供了使用现有数据创建数组的方法。 numpy.asarray 要使用列表或元组创建ndarray数组，可使用asarray函数。这个函数通常用于将python序列转换为numpy数组对象的场景中。语法如下所示： numpy.asarray(sequence, dtype = None, 阅读全文

posted @ 2020-06-19 10:05 大码王阅读(428) 评论(0) 推荐(0) 编辑

Python机器学习（三十七）NumPy 数组创建

摘要：要创建ndarray数组对象，除了使用底层的ndarray构造函数(ndarray.array())，还可以使用下面介绍的函数。 numpy.empty empty函数创建未初始化数组，可以指定数组形状和数据类型。语法如下所示： numpy.empty(shape, dtype = float, 阅读全文

posted @ 2020-06-19 10:00 大码王阅读(278) 评论(0) 推荐(0) 编辑

Python机器学习（三十六）NumPy 数据类型

摘要：NumPy提供的数值类型，数值范围比Python提供的数值类型更大。NumPy的数值类型，如下表所示： SN数据类型描述 1 bool_ 布尔值，取值ture/false，占用一个字节 2 int_ 是integer的默认类型。与C语言中的long类型相同，有可能是64位或32位。 3 intc 类阅读全文

posted @ 2020-06-18 18:39 大码王阅读(359) 评论(0) 推荐(0) 编辑

Python机器学习（三十五）NumPy ndarray

摘要：NumPy中最重要的类是ndarray，ndarray是存储单一数据类型的多维数组。可以使用索引(从0开始)访问ndarray对象中的元素。 ndarray的内存结构标准的Python列表(list)中，元素是对象。如：L = [1, 2, 3]，需要3个指针和三个整数对象，对于数值运算比较浪费阅读全文

posted @ 2020-06-18 18:28 大码王阅读(1283) 评论(0) 推荐(0) 编辑

Python机器学习（三十四）Numpy 介绍

摘要：Numpy代表numeric python，是一个用于计算、处理多维数组的python包。 NumPy包由Travis Oliphant在2005年创建，基于原来的Numeric模块与Numarray模块，大部分是用c语言编写的。 NumPy提供各种强大的数据结构(多维数组和矩阵)，以及对这些数据结阅读全文

posted @ 2020-06-18 18:04 大码王阅读(334) 评论(0) 推荐(0) 编辑

Python机器学习（三十三）Sklearn 速查

摘要：Scikit-learn是一个开源Python库，它使用统一的接口实现了一系列机器学习、预处理、交叉验证和可视化算法。一个基本例子 from sklearn import neighbors, datasets, preprocessing from sklearn.model_selection 阅读全文

posted @ 2020-06-18 17:55 大码王阅读(351) 评论(0) 推荐(0) 编辑

Python机器学习（三十二）Sklearn 支持向量机

摘要：前面章节尝试了K均值聚类模型，准确率并不高。接下来我们尝试一种新方法：支持向量机(SVM)。支持向量机支持向量机(support vector machine/SVM)，通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，其学习策略便是间隔最大化，最终可转化为一个凸阅读全文

posted @ 2020-06-18 17:42 大码王阅读(1093) 评论(0) 推荐(1) 编辑

Python机器学习（三十一）Sklearn K均值聚类

摘要：到目前为止，我们已经非常深入地了解了数据集，并且把它分成了训练子集与测试子集。接下来，我们将使用聚类方法训练一个模型，然后使用该模型来预测测试子集的标签，最后评估该模型的性能。聚类(clustering)是在一组未标记的数据中，将相似的数据（点）归到同一个类别中的方法。聚类与分类的最大不同在于分阅读全文

posted @ 2020-06-18 17:21 大码王阅读(706) 评论(0) 推荐(0) 编辑

Python机器学习（三十）Sklearn 预处理数据

摘要：前面章节中，我们首先加载数据，接着查看数据集的基本信息，然后可视化数据进一步查看数据集信息。接下来，我们开始处理数据，但这之前，通常需要预处理数据。数据标准化大型数据分析项目中，数据来源不同，量纲及量纲单位不同，为了让它们具备可比性，需要采用标准化方法消除由此带来的偏差。原始数据经过数据标准化处阅读全文

posted @ 2020-06-18 17:18 大码王阅读(566) 评论(0) 推荐(0) 编辑

Python机器学习（二十九）Sklearn 可视化数据:主成分分析(PCA)

摘要：主成分分析(PCA)是一种常用于减少大数据集维数的降维方法，把大变量集转换为仍包含大变量集中大部分信息的较小变量集。减少数据集的变量数量，自然是以牺牲精度为代价的，降维的好处是以略低的精度换取简便。因为较小的数据集更易于探索和可视化，并且使机器学习算法更容易和更快地分析数据，而不需处理无关变量。阅读全文

posted @ 2020-06-18 17:13 大码王阅读(4757) 评论(0) 推荐(0) 编辑

Python机器学习（二十八）Sklearn 使用matplotlib可视化数据

摘要：digits是一个手写数字的数据集，我们可以使用Python的数据可视化库，比如matplotlib，来查看这些手写数字图像。示例显示digits.images中的手写数字图像。 from sklearn import datasets # 加载 `digits` 数据集 digits = da 阅读全文

posted @ 2020-06-18 17:12 大码王阅读(1417) 评论(0) 推荐(0) 编辑

Python机器学习（二十七）Sklearn 数据集基本信息

摘要：前面章节中，我们加载了SciKit-Learn自带的数据集digits，可以通过以下语句查看数据集中包含哪些主要内容： digits.keys() 输出 dict_keys(['data', 'target', 'target_names', 'images', 'DESCR']） data 样本数阅读全文

posted @ 2020-06-18 17:08 大码王阅读(759) 评论(0) 推荐(0) 编辑

Python机器学习（二十六）Sklearn 加载数据集

摘要：机器学习是计算机科学的一个分支，研究的是无需人类干预，能够自己学习的算法。与TensorFlow不同，Scikit-learn(sklearn)的定位是通用机器学习库，而TensorFlow(tf)的定位主要是深度学习库。数据科学中的第一步通常都是加载数据，我们首先学习怎么使用SciKit-Le 阅读全文

posted @ 2020-06-18 17:05 大码王阅读(2561) 评论(0) 推荐(0) 编辑

Python机器学习（二十五）尬聊机器学习

摘要：如果你从来没有使用过机器学习，你会想，这个不就是编程吗？或者，到底机器学习是什么？首先，我们确实是使用编程语言来实现机器学习模型，我们跟计算机其他领域一样，使用同样的编程语言和硬件。但不是每个程序都用了机器学习。对于第二个问题，精确定义机器学习就像定义什么是数学一样难，但我们试图在这章提供一些直观的阅读全文

posted @ 2020-06-18 15:08 大码王阅读(344) 评论(0) 推荐(0) 编辑

Python机器学习（二十四）机器学习常见算法分类汇总

摘要：机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法，以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是，很多算法是一类算法，而有些算法又是从其他算法中延伸出来的。这里，我们从两个方面来给大家阅读全文

posted @ 2020-06-18 14:13 大码王阅读(1435) 评论(1) 推荐(0) 编辑

Python机器学习（二十三）机器学习简史

摘要：自从科学，技术和人工智能的最初立场出发，跟随布莱斯·帕斯卡（Blaise Pascal）和冯·莱布尼兹（Von Leibniz）的科学家们在思考这种机器具有与人类一样多的智力。儒勒·凡尔纳（Jules Verne），弗兰克·鲍姆（Frank Baum，绿野仙踪），玛丽·雪莉（Frankkenstei 阅读全文

posted @ 2020-06-18 14:10 大码王阅读(316) 评论(0) 推荐(0) 编辑

Python机器学习（二十二）马尔科夫算法

摘要：1. 前言隐马尔科夫HMM模型是一类重要的机器学习方法，其主要用于序列数据的分析，广泛应用于语音识别、文本翻译、序列预测、中文分词等多个领域。虽然近年来，由于RNN等深度学习方法的发展，HMM模型逐渐变得不怎么流行了，但并不意味着完全退出应用领域，甚至在一些轻量级的任务中仍有应用。本系列博客将详细阅读全文

posted @ 2020-06-18 11:26 大码王阅读(326) 评论(0) 推荐(0) 编辑

Python机器学习（二十一）随机森林算法

摘要：一、随机森林算法简介：在机器学习中，随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而 "Random Forests" 是他们的商标。这个术语是1995年由贝尔实验室的Tin 阅读全文

posted @ 2020-06-18 09:50 大码王阅读(1726) 评论(0) 推荐(0) 编辑

Python机器学习（二十）决策树系列三—CART原理与代码实现

摘要：ID3，C4.5算法缺点 ID3决策树可以有多个分支，但是不能处理特征值为连续的情况。在ID3中，每次根据“最大信息熵增益”选取当前最佳的特征来分割数据，并按照该特征的所有取值来切分，也就是说如果一个特征有4种取值，数据将被切分4份，一旦按某特征切分后，该特征在之后的算法执行中，将不再起作用，阅读全文

posted @ 2020-06-17 18:56 大码王阅读(1870) 评论(1) 推荐(0) 编辑

公告

青青陵上柏，磊磊涧n&f

运行时长：2258天0小时58分8秒

您的浏览器不兼容canvas

昵称：大码王
园龄： 5年8个月
粉丝： 233
关注： 30

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类 (719)

clickhouse(4)

flink源码分析(2)

Groovy(1)

Java(34)

Linux(3)

office(10)

OpenStack入门(1)

Phoenix+hbase(11)

photoshop(10)

python之绘图(7)

python之爬虫(15)

python之入门到实战(26)

shell大全(1)

SparkCore(14)

sparkGraphx(2)

sparksql(8)

sparkstreaming(17)

spark源码分析(11)

博客园美化(6)

操作系统(1)

随笔档案 (693)

2024年5月(4)

2024年3月(3)

2023年9月(1)

2023年4月(2)

2023年3月(4)

2023年2月(1)

2022年12月(1)

2022年11月(1)

2022年9月(2)

2022年8月(17)

2022年7月(5)

2022年5月(3)

2022年4月(18)

2021年9月(1)

2021年6月(9)

2021年5月(19)

2021年2月(1)

2021年1月(17)

2020年12月(7)

2020年11月(19)

文章分类 (35)

airflow(4)

azkban(1)

canal(1)

Cassandra(1)

datax(1)

druid(1)

Elasticsearch(8)

java(11)

mongodb(2)

redis(3)

scala(2)

文章档案 (40)

2024年4月(2)

2023年5月(2)

2023年4月(1)

2023年1月(1)

2020年6月(9)

2020年5月(25)

随笔分类 - 人工智能之机器学习

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类 (719)

随笔档案 (693)

文章分类 (35)

文章档案 (40)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

喜欢请打赏