P7 二分分类
逻辑斯蒂回归是一种二进制分类算法
比如说我们举个例子
这样一个案例中,你需要输入图像,输出标签,识别判断这个图像是/不是一只猫(用0/1表示)
在计算机中,怎么让计算机接受图片,或者说计算机只认识二进制语言,怎么让它看见这些图像数据???
如果说你传入的图像是一张64像素位*64像素位的图片
那么计算机会生成三张64x64的记录了RGB数值大小的表格来显示每一个像素点上的RGB强度值
我们需要将这三张表按序输入成特征向量x
比如说x=(255,231,42,22,123.................255,134,202......................255,134,93.....142)这个向量的维数(dimension)就是64x64x3=12288
我们会用n表示这个x的维数
我们要学怎么使用一个分类器来输入这张图象的特征向量x然后判断,输出y
我们介绍一下用到的变量
单个的训练集是(x,y)
我们用m_train表示训练集m,形式是按照(x,y)对,一共有m对
我们用m_test表示测试集
我们为了更方便的编程处理数据。
X是一个将x特征向量当作列向量,按列排列的矩阵,这个矩阵有m行,n列 代表着这个x维数是n,训练集个数是m
用python表示这个X,可以写成
X.shape=(n,m)#这边描述是 宽乘长
Y是将判断标签按一行排开,python写成
Y.shape=(1,m)