摘要:
Keras是Tensorflow2.0的核心高阶API,其内置了一些常用的公共数据集,给开发者使用。 以波士顿房价数据集为例,其涵盖了麻省波士顿的506个不同郊区的房屋数据。有404条训练数据集和102条测试数据集。 每条数据有14个字段,包含13个属性和一个房价数据 获取波士顿房价数据集: 1 i 阅读全文
摘要:
1 import matplotlib.pyplot as plt 2 3 plt.rcParams['font.family'] = 'SimHei' 4 5 fig = plt.figure(facecolor = 'lightgrey') 6 7 plt.subplot(2,2,1) 8 pl 阅读全文
摘要:
对于对数运算,Tensorflow中之提供了e为底数的对数运算tf.math.log(x),如果想要自定义底数,可以利用换底公式 张量运算的广播机制:如果一个高维张量和低维张量相乘,则会将低维张量广播到高维张量上。例如一个2维张量加一个1维张量: 再例如:一个3维张量加(乘)一个一维张量: 另外,说 阅读全文
摘要:
tf.concat和tf.stack这两个函数都是合并张量。但是其合并结果不一样。 tf.concat合并之后不改变原来张量的维度,比如合并两个二维的张量,结果还是二维的。 而tf.stack会改变维度,比如合并两个二维的张量,合并后的结果是三维的。 嗯,就这样。 阅读全文
摘要:
K-Means属于非监督分类,在数据聚类中是相对容易也是非常经典的算法。通常用在大量数据需要进行分类的时候。K表示要把数据分类K类。 其计算步骤为(以K=3为例): 1、随机在数据当中抽取3个样本,当做三个类别的中心点(绿、红、蓝)。 2、其次,计算其余的点分别到这三个中心点的距离,这样每一个样本都 阅读全文
摘要:
回归是统计学中最有力的工具之一。机器学习监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测,针对的是数值型的样本,使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升,因为这样可以预测连续型数据而不仅仅是离散的类别标 阅读全文
摘要:
概念理解: 在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。利用相同的训练数搭建多个独立的分类模型,然后通过投票的方式,以少数服从多数的原则作出最终的分类决策。例如, 如果你训练了5个树, 其中有4个树的结果是True, 1个数的结果是False, 阅读全文
摘要:
理解决策树原理 决策树是一种基本的分类方法,从编程语言的角度理解决策树其实就是很多个if....else...组成的条件筛选,如果满足给出的第一个条件就进入下一个条件筛选,如果不满足就退出来.... 类似下面这样图:(图片来自于:https://zhuanlan.zhihu.com/p/300594 阅读全文
摘要:
背景 室友让我帮他从一个国外的FTP服务器上面爬一些数据。以前只是从网页上面爬,还没有从FTP服务器爬过,然后网上大概搜了一下,写了个简单的小demo。 安利一款自己在用的连接工具: IIS7服务器管理工具是一款windows全系、Linux系统下链接并操控VPS、VNC、FTP等远程服务器、云服务 阅读全文