摘要: 好久好久没有更新博客了,之前自学的估计也都忘记差不多了。由于毕业选择从事的行业与自己的兴趣爱好完全两条路,心情也难过了很久,既然入职了就要好好干,仍要保持自己的兴趣,利用业余时间重拾之前的乐趣。 从基本的数据清理学起吧 讲一下drop函数的用法 删除表中的某一行或者某一列更明智的方法是使用drop, 阅读全文
posted @ 2019-03-08 10:32 Freeman耀 阅读(55526) 评论(0) 推荐(0) 编辑
摘要: 四、SVM支持向量机 1、代价函数 在逻辑回归中,我们的代价为: 其中: 如图所示,如果y=1,cost代价函数如图所示 我们想让,即z>>0,这样的话cost代价函数才会趋于最小(这正是我们想要的),所以用图中红色的函数代替逻辑回归中的cost 当y=0时同样用代替 最终得到的代价函数为: 最后我 阅读全文
posted @ 2018-01-10 21:03 Freeman耀 阅读(2246) 评论(0) 推荐(0) 编辑
摘要: 三、BP神经网络 1、神经网络模型 首先介绍三层神经网络,如下图 输入层(input layer)有三个units(为补上的bias,通常设为1) 表示第j层的第i个激励,也称为单元unit 为第j层到第j+1层映射的权重矩阵,就是每条边的权重 所以可以得到: 隐含层: 输出层: 其中,S型函数,也 阅读全文
posted @ 2017-12-17 14:23 Freeman耀 阅读(2230) 评论(0) 推荐(0) 编辑
摘要: 二、逻辑回归 1、代价函数 可以将上式综合起来为: 其中: 为什么不用线性回归的代价函数表示呢?因为线性回归的代价函数可能是非凸的,对于分类问题,使用梯度下降很难得到最小值,上面的代价函数是凸函数的图像如下,即y=1时: 可以看出,当趋于1,y=1,与预测值一致,此时付出的代价cost趋于0,若趋于 阅读全文
posted @ 2017-12-15 20:05 Freeman耀 阅读(2921) 评论(0) 推荐(0) 编辑
摘要: 最近在GitHub上学习了有关python实现常见机器学习算法 目录 一、线性回归 1、代价函数 2、梯度下降算法 3、均值归一化 4、最终运行结果 5、使用scikit-learn库中的线性模型实现 二、逻辑回归 1、代价函数 2、梯度 3、正则化 4、S型函数 5、映射为多项式 6、使用的优化方 阅读全文
posted @ 2017-12-15 15:47 Freeman耀 阅读(13720) 评论(0) 推荐(0) 编辑
摘要: 根据以上两篇的分析,下面我们还要对数据进行处理,观察Age和Fare两个属性,乘客的数值变化幅度较大!根据逻辑回归和梯度下降的了解,如果属性值之间scale差距较大,将对收敛速度造成较大影响,甚至不收敛!因此,我们需要运用scikit-learn里面的preprocessing模块对Age和Fare 阅读全文
posted @ 2017-12-05 10:10 Freeman耀 阅读(670) 评论(0) 推荐(0) 编辑
摘要: 下面我们再来看看各种舱级别情况下各性别的获救情况 得到下图 下面再看看大家族对结果有什么影响 PassengerId SibSp Survived 0 0 398 1 210 1 0 97 1 112 2 0 15 1 13 3 0 12 1 4 4 0 15 1 3 5 0 5 8 0 7 Pas 阅读全文
posted @ 2017-11-20 16:29 Freeman耀 阅读(516) 评论(0) 推荐(0) 编辑
摘要: 大家都熟悉的『Jack and Rose』的故事,豪华游艇倒了,大家都惊恐逃生,可是救生艇的数量有限,无法人人都有,副船长发话了『lady and kid first!』,所以是否获救其实并非随机,而是基于一些背景有rank先后的。 训练和测试数据是一些乘客的个人信息以及存活状况,要尝试根据它生成合 阅读全文
posted @ 2017-11-10 18:26 Freeman耀 阅读(631) 评论(0) 推荐(1) 编辑
摘要: 决策树是一种有监督学习算法,决策树可用于分类问题,也可用于回归问题。决策树的优点是可读性强,分类速度快。学习决策树时,通常采用损失函数最小化原则。 scikit-learn中有两类决策树,他们均采用优化的CART决策树算法。 1.回归决策树(DecisionTreeRegressor) Decisi 阅读全文
posted @ 2017-11-08 15:50 Freeman耀 阅读(1242) 评论(0) 推荐(0) 编辑
摘要: 当我们使用resquests.get()时,返回的时response的对象,他包含服务器返回的所有信息,也包含请求的request的信息。 首先: response对象的属性有以下几个, r.status_code是http请求的返回状态,200表示连接成功,404表示连接失败,这时候应该抛出异常, 阅读全文
posted @ 2017-10-19 19:38 Freeman耀 阅读(564) 评论(0) 推荐(0) 编辑