22-用scikit-learn实现分类任务(感知机)

Posted on 2017-09-17 20:32  LoveAI  阅读(456)  评论(0编辑  收藏  举报

每年一次的教师节,都勾起好多回忆。我想起高中数学老师,鹤发童颜、和蔼可亲,却天真如小孩。经常兴高采烈地拿着一张手写的题目,来到自习课堂,神神秘秘地对我说:做做看,不错。对于一些难题的评价是:有味道、有意思。我想大家都有一些珍藏的记忆。他在高考前夕对我们说的做人要有“信、望、爱”,足以支撑我走过漫长坎坷的人生路。他的QQ昵称是“青蛙王子”,在他身上我看到心态年轻的人永远不会老。

 

今天学习如何用用scikit-learn完成鸢尾花数据集的分类任务:

 

  • 加载鸢尾花数据集&对数据进行预处理

     

鸢尾花数据集可以从scikit-learn库中直接加载,其中X的第三列代表花瓣长度(petal length),第四列代表花瓣宽度(petal width),Y代表的类别已被转为整数:0=Iris-Setosa(山鸢尾),1=Iris-Versicolor(杂色鸢尾),2=Iris-Virginica(维尔吉妮卡鸢尾)。

 

将数据集拆分为70%训练集,30%测试集:

 

将特征标准化(新数据=(原数据-均值)/标准差):

 

  • 用scikit-learn训练一个感知机

Peceptron 模型对于并不是完全线性隔离的 dataset 不能 converge,所以实际应用中并不多用。

 

下周学习如何用scikit-learn实现逻辑回归模型,敬请期待:)