摘要: 前言 出于对数据分析及数据挖掘的兴趣,我开始接触Python,由于缺乏编程相关知识,所以过程满是曲折,也缺乏足量的实践练习。写这一系列文章的原因首先是为了锻炼自己,因为我相信费曼的学习方法:要在教学中才能真正掌握所学的知识;其次也是想借此机会给未入门的朋友们一些门槛比较低的参考资料,所以本系列文章均 阅读全文
posted @ 2018-12-25 20:25 对抗拖延症的二傻子 阅读(261) 评论(0) 推荐(0) 编辑
摘要: import numpy as np from sklearn import datasets# 载入数据包 import numpy as np from sklearn import datasets# 载入数据包 import numpy as np from sklearn import d 阅读全文
posted @ 2019-05-05 11:22 对抗拖延症的二傻子 阅读(805) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-05-05 11:19 对抗拖延症的二傻子 阅读(132) 评论(0) 推荐(0) 编辑
摘要: In [1]: from sklearn import datasets In [2]: boston = datasets.load_boston() X = boston.data y = boston.target #去除不真实的数据 X = X[y < 50] y = y[y < 50] ​ 阅读全文
posted @ 2019-04-24 12:41 对抗拖延症的二傻子 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 理解 特点 作用 最小化一个损失函数 最大化一个效用函数:梯度上升法 随机梯度下降法 以单个数据作为梯度下降的依据 优点 批量梯度下降法 以整体数据作为每次梯度下降的方向的根据 小批量梯度下降法 以K个数据作为梯度下降的依据 故事 用损失函数做一个滑梯或者一个碗,定义一个重力方向,让他朝下,放一个小 阅读全文
posted @ 2019-04-24 12:38 对抗拖延症的二傻子 阅读(222) 评论(0) 推荐(0) 编辑
摘要: 线性回归算法 线性回归算法 线性回归算法 In [ ]: import numpy as np import matplotlib.pyplot as plt from sklearn import datasets In [ ]: import numpy as np import matplot 阅读全文
posted @ 2019-04-19 12:57 对抗拖延症的二傻子 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 理解 以a b为变量,预测值与真值的差的平方和为结果的函数 参数学习的基本方法:找到最优参数使得预测与真实值差距最小 假设可以找到一条直线 y = ax+b 使得预测值与真值的差的平方和最小 故事 假设你面前有一堆男人 这些男人的基本信息全部掌握,包括他们的年收入 简单线性回归 简单线性回归的思想就 阅读全文
posted @ 2019-04-19 12:36 对抗拖延症的二傻子 阅读(118) 评论(0) 推荐(0) 编辑
摘要: import numpy as np from sklearn import datasets# 载入数据包 import numpy as np from sklearn import datasets# 载入数据包 import numpy as np from sklearn import d 阅读全文
posted @ 2019-04-18 17:39 对抗拖延症的二傻子 阅读(492) 评论(0) 推荐(0) 编辑
摘要: 理解 用一个实际生活的例子来解释 假设你面前有一堆男人 分类问题: 这些男人的基本信息全部掌握,有一些是渣男,有一些是好男人,有一些是正常人 现在新来了几个男人,基本信息全部掌握,没有标注男人类型,需要从已知的男人作为参考,判断新来的男人的类型 KNN的思想就是:对每一个新来的男人,找出和他基本信息 阅读全文
posted @ 2019-04-18 15:48 对抗拖延症的二傻子 阅读(119) 评论(0) 推荐(0) 编辑
摘要: Getting Started with pandas Getting Started with pandas Getting Started with pandas In [1]: import pandas as pd In [1]: import pandas as pd In [1]: In 阅读全文
posted @ 2019-04-11 14:15 对抗拖延症的二傻子 阅读(529) 评论(0) 推荐(0) 编辑