11-21

念念不忘 必有回响

2019年11月22日

A--集成算法的实现

摘要: 集成算法,一种简单好用的算法思路,保存在这里方便以后复习 阅读全文

posted @ 2019-11-22 15:27 11-21 阅读(430) 评论(0) 推荐(0) 编辑

A--随机森林(RF)的 sciklit-learn 实现

摘要: 一、决策树的决策边界 In [2]: import numpy as np import pandas as pd In [7]: #利用sklearn中提供的make_blobs函数生成一个服从高斯分布的二维数组,且将其随机分为四类 from sklearn.datasets import mak 阅读全文

posted @ 2019-11-22 14:14 11-21 阅读(515) 评论(0) 推荐(0) 编辑

A--Scikit-Learn 实现决策树

摘要: 决策树分类方法速度很快,⽽且不需要进行数据清洗,所以通常很适合作为初步分类手段,在借助更复杂的模型进行优化之前使用。 选择模型类 在Scikit-Learn中分类树算法都保存在tree模块中,具体算法所属类为DecisionTreeClassifier In [1]: from sklearn.tr 阅读全文

posted @ 2019-11-22 13:57 11-21 阅读(335) 评论(0) 推荐(0) 编辑

A--Scikit-Learn入门

摘要: 1.数据接口 基本数据表是二维表格数据其中,一行表示一个样本,一列表示一个相关特征,同时对于有监督学习而言,还需要一列特征充当标签列,通常再数据读取为DataFrame格式,方便前期探索 特征矩阵简称X,它通常用DataFrame或者Numpy数组表示,目标数组简称y,一般是一维数组 通常用一维Nu 阅读全文

posted @ 2019-11-22 13:41 11-21 阅读(195) 评论(0) 推荐(0) 编辑

A--最近邻分类器-KNN

摘要: #导入必要的包 import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt %matplotlib inline 构建一个KNN分类器 假设输入数据集最后一列是标签,其 阅读全文

posted @ 2019-11-22 13:14 11-21 阅读(422) 评论(0) 推荐(0) 编辑

A--K-Means快速聚类

摘要: 聚类概述 皆在理解/探索数据的某些自然结构,商业上最有名的FRM(客户价值评估模型)就是聚类分析的一种数据处理,降维,数据离散压缩,有效的发现最近邻居等。 种类 1.K-Means:K均值是基于原型的,划分的聚类计数,它试图发现用户指定个数(K)的簇,(由质心代表) 2.层次聚类:把数据划分为又层次 阅读全文

posted @ 2019-11-22 13:01 11-21 阅读(404) 评论(0) 推荐(0) 编辑

A--无监督学习算法示例: DBSCAN(聚类)

摘要: K-Means对非球形边界的数据很难达到⼀个较好的分类效果,因此我们需要借助另外的数学理论工具对其进行进一步的完善。利⽤密度进行聚类的方法: DBSCAN。 DNSCAN是⼀种基于密度的聚类方法,旨在寻找被低密度区域分离的高密度区域。 DBSCAN是⼀种简单、有效的基于密度的聚类算法,且包含了基于密 阅读全文

posted @ 2019-11-22 12:19 11-21 阅读(451) 评论(0) 推荐(0) 编辑

A-无监督学习算法示例:层次聚类

摘要: 层次聚类基本原理 ⼀种针对小样本精确聚类的聚类算法:层次聚类法。所谓更更加精准,⼀方面是指该聚类方法在执行过程中全程保持透明,另⼀面则是在真实的应用场景中,针对数据量不大(数千行左右)的数据,层次聚类往会有一个⾮常好的聚类效果 其首先会计算所有数据中最邻近的点,将其归为一个簇,然后取其质心作为簇的代 阅读全文

posted @ 2019-11-22 01:17 11-21 阅读(275) 评论(0) 推荐(0) 编辑

A-岭回归的python'实现

摘要: 虽然在线性回归的求解过程中,通过借助最⼩⼆乘法能够迅速找到全域最优解,但最⼩⼆乘法本身的使⽤条件较为苛刻,必须要求当 为满秩矩阵或正定阵时才可进⾏逆矩阵或⼴义逆矩阵的求解, 在实际应⽤中经常会遇⻅矩阵不存在逆矩阵或⼴义逆矩阵的情况,并且当X的各列存在线性相关关系 (即多重共线性)的时候,最⼩⼆乘法的 阅读全文

posted @ 2019-11-22 01:13 11-21 阅读(1736) 评论(0) 推荐(0) 编辑

A--利用梯度下降求解逻辑回归的python实现

摘要: #导入必要的包 import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt %matplotlib inline BGD求解逻辑回归 In [2]: #⾸先定义联系函数 阅读全文

posted @ 2019-11-22 00:59 11-21 阅读(611) 评论(0) 推荐(0) 编辑

A--python梯度下降算法实践

摘要: In [1]: import numpy as np import pandas as pd import matplotlib import matplotlib.pyplot as plt %matplotlib inline In [2]: #自定义一个归一化函数(此函数的前提是我的数据是一个 阅读全文

posted @ 2019-11-22 00:46 11-21 阅读(296) 评论(0) 推荐(0) 编辑

A--多元线性回归的python实现

摘要: In [1]: import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt In [2]: #创建一个矩阵 a = np.array([[1, 2], [3, 4]]) 阅读全文

posted @ 2019-11-22 00:35 11-21 阅读(843) 评论(0) 推荐(0) 编辑

国民经济数据可视化

摘要: import numpy as np import matplotlib.pyplot as plt %matplotlib inline plt.rcParams['font.sans-serif'] = 'Arial Unicode MS' ## 设置中文显示 plt.rcParams['axe 阅读全文

posted @ 2019-11-22 00:21 11-21 阅读(2453) 评论(0) 推荐(0) 编辑

python 爬虫实列

摘要: 第一个爬虫(爬取图片) In [5]: import urllib.request In [6]: #创建一个ruquest对象 url="https://tieba.baidu.com/p/6310762577" request=urllib.request.Request(url) #连接url 阅读全文

posted @ 2019-11-22 00:10 11-21 阅读(521) 评论(0) 推荐(0) 编辑

导航