随笔分类 - Python
摘要:pytorch数学运算与统计属性入门1、Broadcasting (维度)自动扩展,具有以下两个重要特征:(1)expand (2)without copying data重点的核心实现功能是:(1)在前面增加缺失的维度(2)将其中新增加的维度的size扩展到需要相互运算的tensor维度的same
阅读全文
摘要:(1-1)pytorch张量数据的索引与切片操作1、对于张量数据的索引操作主要有以下几种方式:a=torch.rand(4,3,28,28):DIM=4的张量数据a(1)a[:2]:取第一个维度的前2个维度数据(不包括2);(2)a[:2,:1,:,:]:取第一个维度的前两个数据,取第2个维度的前1
阅读全文
摘要:pytorch张量数据类型入门1、对于pytorch的深度学习框架,其基本的数据类型属于张量数据类型,即Tensor数据类型,对于python里面的int,float,int array,flaot array对应于pytorch里面即在前面加一个Tensor即可——intTensor ,Float
阅读全文
摘要:利用平pytorch搭建简单的神经网络实现minist手写字体的识别,采用三层线性函数迭代运算,使得其具备一定的非线性转化与运算能力,其数学原理如下: 其具体实现代码如下所示:import torchimport matplotlib.pyplot as pltdef plot_curve(data): #曲线输出函数构建 fig=plt.figure() plt.pl...
阅读全文
摘要:对于pytorch的深度学习框架,在建立人工神经网络时整体的步骤主要有以下四步: 1、载入原始数据 2、构建具体神经网络 3、进行数据的训练 4、数据测试和验证 pytorch神经网络的数据载入,以MINIST书写字体的原始数据为例: import torch import matplotlib.p
阅读全文
摘要:如何将本地项目上传至GitHub 首先你需要一个github账号,所有还没有的话先去注册吧! https://github.com/ 我们使用git需要先安装git工具,这里给出下载地址,下载后一路直接安装即可: https://git-for-windows.github.io/ 1.进入Gith
阅读全文
摘要:1、集成学习是指对于同一个基础数据集使用不同的机器学习算法进行训练,最后结合不同的算法给出的意见进行决策,这个方法兼顾了许多算法的"意见",比较全面,因此在机器学习领域也使用地非常广泛。生活中其实也普遍存在集成学习的方法,比如买东西找不同的人进行推荐,病情诊断进行多专家会诊等,考虑各方面的意见进行最
阅读全文
摘要://2019.08.19#机器学习集成学习1、集成学习是指对于同一个基础数据集使用不同的机器学习算法进行训练,最后结合不同的算法给出的意见进行决策,这个方法兼顾了许多算法的"意见",比较全面,因此在机器学习领域也使用地非常广泛。 集成学习(ensemble learning)本身不是一个单独的机器学
阅读全文
摘要:1、决策树算法是一种非参数的决策算法,它根据数据的不同特征进行多层次的分类和判断,最终决策出所需要预测的结果。它既可以解决分类算法,也可以解决回归问题,具有很好的解释能力。另外,对于决策树的构建方法具有多种出发点,它具有多种构建方式,如何构建决策树的出发点主要在于决策树每一个决策点上需要在哪些维度上
阅读全文
摘要://2019.08.17#决策树算法1、决策树算法是一种非参数的决策算法,它根据数据的不同特征进行多层次的分类和判断,最终决策出所需要预测的结果。它既可以解决分类算法,也可以解决回归问题,具有很好的解释能力。 图 原理图2、对于决策树的构建方法具有多种出发点,它具有多种构建方式,如何构建决策树的出发
阅读全文
摘要:1、支撑向量机SVM是一种非常重要和广泛的机器学习算法,它的算法出发点是尽可能找到最优的决策边界,使得模型的泛化能力尽可能地好,因此SVM对未来数据的预测也是更加准确的。 2、SVM既可以解决分类问题,又可以解决回归问题,原理整体相似,不过也稍有不同。 在sklearn章调用SVM算法的代码实现如下
阅读全文
摘要://2019.08.17 #支撑向量机SVM(Support Vector Machine)1、支撑向量机SVM是一种非常重要和广泛的机器学习算法,它的算法出发点是尽可能找到最优的决策边界,使得模型的泛化能力尽可能地好,因此SVM对未来数据的预测也是更加准确的。 2、支撑向量机SVM有两种:Hard
阅读全文
摘要:sklearn分类算法的评价指标调用#二分类问题的算法评价指标import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn import datasetsd=datasets.load_digits(
阅读全文
摘要://2019.08.14#机器学习算法评价分类结果1、机器学习算法的评价指标一般有很多种,对于回归问题一般有MAE,MSE,AMSE等指标,而对于分类算法的评价指标则更多:准确度score,混淆矩阵、精准率、召回率以及ROC曲线、PR曲线等。2、对于分类算法只用准确率的评价指标是不够的,并且对于一些
阅读全文
摘要:sklearn中实现多分类任务(OVR和OVO) 1、OVR和OVO是针对一些二分类算法(比如典型的逻辑回归算法)来实现多分类任务的两种最为常用的方式,sklearn中专门有其调用的函数,其调用过程如下所示: #多分类任务的封装OVR(n个)和OVO(Cmn个)#sklearn中采用的逻辑回归是可以
阅读全文
摘要:sklearn实现多分类逻辑回归 #二分类逻辑回归算法改造适用于多分类问题1、对于逻辑回归算法主要是用回归的算法解决分类的问题,它只能解决二分类的问题,不过经过一定的改造便可以进行多分类问题,主要的改造方式有两大类:(1)OVR/A(One VS Rest/ALL)(2)OVO(One VS One
阅读全文
摘要:1、逻辑回归算法即可以看做是回归算法,也可以看作是分类算法,通常用来解决分类问题,主要是二分类问题,对于多分类问题并不适合,也可以通过一定的技巧变形来间接解决。 2、决策边界是指不同分类结果之间的边界线(或者边界实体),它具体的表现形式一定程度上说明了算法训练模型的过拟合程度,我们可以通过决策边界来
阅读全文
摘要:逻辑回归的数学原理推导及原理代码实现 1、逻辑回归算法是目前应用最为广泛的一种算法,虽然是回归算法,但是它解决的是分类问题,而不是回归问题,它的原理是将样本的特征与样本发生的概率,而概率是一个数字,因此将其称为回归算法。 2、对于逻辑回归因为得到的预测结果是事件的发生概率,因此它的预测值值域为0-1
阅读全文
摘要://2019.08.13#逻辑回归算法(Logistic Regression)1、根据2017-2018年人工智能与大数据科学领域的统计,不同的机器学习算法应用占比排名如下,其中,逻辑回归、决策树、随机森林以及人工神经网络算法占比前四,应用最为广泛,其次是贝叶斯算法、集成学习以及支持向量机SVM算
阅读全文
摘要:机器学习的模型泛化 1、机器学习的模型误差主要含有三个方面的误差:模型偏差、模型方差以及不可避免的误差。 2、对于机器学习训练模型的偏差主要因为对于问题本身的假设不对,比如非线性误差假设为线性误差进行训练和预测,算法层面上欠拟合是产生较大偏差的主要原因。另外主要来自于特征参量与最终结果的相关性,如果
阅读全文