04 2019 档案
摘要:import numpy as np import sklearn.datasets #加载原数据 import matplotlib.pyplot as plt import random #点到各点距离 def PointToData(point,dataset): a = np.multiply(dataset - point,dataset - poin...
阅读全文
摘要:mean()函数功能:求取均值经常操作的参数为axis,以m * n矩阵举例: axis 不设置值,对 m*n 个数求均值,返回一个实数 axis = 0:压缩行,对各列求均值,返回 1* n 矩阵 axis =1 :压缩列,对各行求均值,返回 m *1 矩阵 举例: >>> import nump
阅读全文
摘要:import numpy as np import sklearn.datasets #加载原数据 from sklearn.model_selection import train_test_split #分割数据 from matplotlib import pyplot as plt from sklearn.linear_model import LinearRe...
阅读全文
摘要:数据一:波士顿房价(适合做回归),以后直接用boston标记 这行代码就读进来了boston = sklearn.datasets.load_boston()查询具体数据说明,用这个代码:print boston.DESCR输出如下:Data Set Characteristics: :Number
阅读全文
摘要:import numpy as np import matplotlib.pyplot as plt #创造数据 x = [-2,6,-2,7,-3,3,0,8,1,10,2,12,2,5,3,6,4,5,2,15,1,10,4,7,4,11,0,3,-1,4,1,5,3,11,4,6] x = np.mat(x).reshape(-1,2) y = [1,1,-1,1,1,1,-1,-1,-1...
阅读全文
摘要:主要公式步骤: 原距离问题的函数: 1.将SVM的距离问题转化为拉格朗日函数: 2.原函数问题化成如下问题: 3.对各非拉格朗日参数求偏导来求min值: 4.将上面 令各偏导等于0 的结果带回 拉格朗日函数 消去非拉格朗日参数(w,b,£) 结果为: 步骤: 5.用SMO算法求α: KKT条件: 将
阅读全文
摘要:1. 线性分类SVM面临的问题 有时候本来数据的确是可分的,也就是说可以用 线性分类SVM的学习方法来求解,但是却因为混入了异常点,导致不能线性可分,比如下图,本来数据是可以按下面的实线来做超平面分离的,可以由于一个橙色和一个蓝色的异常点导致我们没法直接线性分类。 另外一种情况没有这么糟糕到不可分,
阅读全文
摘要:import numpy as np import matplotlib as mpl import matplotlib.pyplot as pltimport random #sigmoid函数定义def sigmoid(x): # print('sigmoid:',x,1.0 / (1+math.exp(-x))) return 1.0 / (1+ np.exp(-x))#模拟...
阅读全文
摘要:import re import numpy as np def file_do(filename): with open(filename,'rb') as f: data = f.read().decode() data = data.split('\n') # print('dasdqaw:',data) words = [] ...
阅读全文
摘要:import numpy as np import math #加载模拟数据 def loaddata(): postingList=[['my','dog','has','flea','problem','help','please'], ['maybe','not','take','him','to','dog','park','stupid'],...
阅读全文
摘要:def classfify(mytree,testdata,labels): # print('mytree:{},testdata:{},labels:{}'.format(mytree,testdata,labels)) firststr = list(mytree.keys())[0] #树中的第一个keys值获取,即第一个特征值名称 ...
阅读全文