07 2020 档案

摘要:Linux的主分区与拓展分区加起来不能超过4个,而且拓展分区最多一个且不能放入数据文件及不能格式化,拓展分区唯一作用就是包含逻辑分区,逻辑分区可以放入数据和格式化。这种限制不是Linux限制,而是硬盘本身的限制。 分区过程就是将大硬盘分成小硬盘,此时小硬盘不能直接使用,必须先格式化。 格式化(高级格 阅读全文
posted @ 2020-07-29 11:07 做梦当财神 阅读(223) 评论(0) 推荐(0) 编辑
摘要:Linux启动时会看到许多启动信息。 Linux启动过程分为5个阶段: 内核的引导 运行init 系统初始化 建立终端 用户登录信息 内核引导 当计算机打开电源后,首先是BIOS(Basic Input/Output System)开机自检,按照BIOS中设置的启动设备(通常是硬盘)来启动。 操作系 阅读全文
posted @ 2020-07-29 02:01 做梦当财神 阅读(252) 评论(0) 推荐(0) 编辑
摘要:基本介绍 登录系统后,输入命令: ls/ 结果如下: Linux的文件系统是级层式的树状目录结构,最上层是根目录“/”,然后在此目录下创建其他目录。 Linux的世界里,一切皆文件。 Linux具体目录结构 /lib 系统开机所需要最基本的动态链接共享库,其类似于Windows里的DLL文件。 /l 阅读全文
posted @ 2020-07-29 01:02 做梦当财神 阅读(254) 评论(0) 推荐(0) 编辑
摘要:交叉检验原理 使用交叉检验最简单的方法是在估计器上调用cross_val_score函数。 下面示例展示如何通过分割数据,拟合模型和计算连续5次的分数(每次不同分割)来估计linear Kernel支持向量机在iris数据集上的精度: from sklearn.model_selection imp 阅读全文
posted @ 2020-07-27 17:28 做梦当财神 阅读(5006) 评论(0) 推荐(0) 编辑
摘要:1. sklearn中的Pipeline机制 管道机制在机器学习算法中的应用:参数集在新数据集(比如测试集)上的重复使用。 管道机制实现流式化封装和管理。 2. 加载数据集并拆分 import pandas as pd from sklearn.pipeline import Pipeline fr 阅读全文
posted @ 2020-07-23 12:19 做梦当财神 阅读(273) 评论(0) 推荐(0) 编辑
摘要:DBSCAN是密度聚类算法,和K-Means,BIRCH只适用于凸样本集的聚类相比,DBSCAN既适用于凸样本集,也适用于非凸样本集。 1. 密度聚类原理 DBSCAN算法指类别可通过样本分布的紧密程度决定。即同一类别的样本紧密相连,也就是说在该类别的不远处一定有同类别的样本。 2. DBSCAN密 阅读全文
posted @ 2020-07-23 11:24 做梦当财神 阅读(848) 评论(0) 推荐(0) 编辑
摘要:特征选择(1) 在sklearn.feature_selection模块中,可以对样本集进行特征选择(feature selection)和降维(dimensionality reduction),这样会提高估计器的准确度或者增强在高维数据集上的性能。 1. 移除低方差特征 VarianceThre 阅读全文
posted @ 2020-07-22 23:10 做梦当财神 阅读(335) 评论(0) 推荐(0) 编辑
摘要:分层/多级索引能在较低纬度的数据结构(如Series和DataFrame)中存储和操作任意维度的数据, 1. 创建MultiIndex MultiIndex对象是标准索引Index对象的扩展,可以将MultiIndex看作一个元组数组,其中每个元组都是唯一的。可以从数组列表(MultiIndex.f 阅读全文
posted @ 2020-07-21 16:21 做梦当财神 阅读(1531) 评论(0) 推荐(0) 编辑
摘要:集成学习 随机森林 AdaBoost 算法 提升树 梯度提升树(GBDT) XGBoost 一、提升树 提升树是以 CART 回归树为基本分类器的提升方法。 提升方法采用加法模型(即基函数的线性组合)与前向分步算法。 1. 提升树模型 提升树模型可以表示为决策树的加法模型: $$ \tag{13 阅读全文
posted @ 2020-07-02 18:51 做梦当财神 阅读(763) 评论(0) 推荐(0) 编辑
摘要:字符串的合并,主要有4种方法: 1. 使用“+”组合字符串 例如:输入x='a'+'b'得到x的值是‘ab’。 2. 使用%占位符组合字符串 例如:输入x='I am %s'%'Tony',得到x的值是‘I am Tony’。 3. 使用.join方法将多个可迭代对象合并 例如:输入x=' '.jo 阅读全文
posted @ 2020-07-02 18:49 做梦当财神 阅读(1598) 评论(0) 推荐(0) 编辑
摘要:用途 pandas.cut用来把一组数据分割成离散的区间。比如一组年龄数据,pandas.cut将年龄分割成不同的年龄段并打上标签。 原型 pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3,include_ 阅读全文
posted @ 2020-07-01 12:58 做梦当财神 阅读(401) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示