03 2022 档案

摘要:一、更新软件库 sudo apt-get update 二、安装插件 sudo apt-get upgrade -y 三、安装插件 sudo apt-get install tasksel -y 四、运行 tasksel 运行后进入安装程序,进入GUI界面,通过控制“↑”“↓” 找到Ubuntu d 阅读全文
posted @ 2022-03-27 23:05 Theext 阅读(2087) 评论(0) 推荐(0) 编辑
摘要:通过ifconfig查看网络状况,只有lo本地回环网卡,没有ens33 service network-manager stop #先停止服务 sudo rm -rf /var/lib/NetworkManager/NetworkManager.state #删除网络配置文件 service net 阅读全文
posted @ 2022-03-26 19:17 Theext 阅读(562) 评论(0) 推荐(0) 编辑
摘要:一、查看网卡名称 打开终端使用命令 ifconfig ubuntu系统查看 网卡名称:ens33 本机当前ip为 (inet):192.168.222.135 子网掩码24位(netmask):255.255.255.0 VM 软件查看 网关(IPG):192.168.222.2 二、配置静态ip 阅读全文
posted @ 2022-03-23 23:26 Theext 阅读(1643) 评论(0) 推荐(0) 编辑
摘要:安装插件,然后重启Ubuntu系统 sudo apt-get install open-vm-tools-desktop 阅读全文
posted @ 2022-03-23 22:28 Theext 阅读(267) 评论(0) 推荐(0) 编辑
摘要:继承: public class Super { public static void main(String[]args){ new son().f(); } } class Father{ public int value; public void f(){ value=100; System. 阅读全文
posted @ 2022-03-23 15:51 Theext 阅读(23) 评论(0) 推荐(0) 编辑
摘要:1. 向量 向量(vector)是用于存储数值型、字符型、逻辑型数据的一维数组。标量可以看作是 只含有一个元素的向量。 函数c( )可用来创建向量,例如: In [2]: x1 <- c(2, 4, 1, -2, 5) x2 <- c("one", "two", "three") x3 <- c(T 阅读全文
posted @ 2022-03-23 15:05 Theext 阅读(1313) 评论(0) 推荐(0) 编辑
摘要:使用网格搜索优化钻石价格模型 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 处理缺失数据 3.2 处理类别型字段 3.2.1 统计类别型字段 3.2.2 字符编码和独热编码 3.3 生成自变量和因变量 3.4 拆分数据集 3.5 特征缩放 4. 构建最优模型 5. 应用网 阅读全文
posted @ 2022-03-23 00:07 Theext 阅读(217) 评论(0) 推荐(0) 编辑
摘要:使用k-fold交叉验证法选择最优钻石价格模型 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 处理缺失数据 3.2 处理类别型字段 3.2.1 统计类别型字段 3.2.2 字符编码和独热编码 3.3 生成自变量和因变量 3.4 拆分数据集 3.5 特征缩放 4. 构建不同 阅读全文
posted @ 2022-03-22 23:54 Theext 阅读(686) 评论(0) 推荐(0) 编辑
摘要:实例化同名对象时赋值 public class User { int id; String name; String pwd; public User(){} public User(int id ,String name){ super(); this.id=id; this.name=name; 阅读全文
posted @ 2022-03-21 13:00 Theext 阅读(35) 评论(0) 推荐(0) 编辑
摘要:实例一: public class people { public static void main(String[] args) { person p1 = new person();//实例化一个人,p1 p1.name = "张三"; p1.age = 24; p1.hight = 170; 阅读全文
posted @ 2022-03-21 00:18 Theext 阅读(41) 评论(0) 推荐(0) 编辑
摘要:九九乘法表 public class jiujiu { public static void main(String[] args){ for(int i=1;i<=9;i++){ for(int j=1;j<=i;j++){ System.out.print(j+"*"+i+"="+(i*j<10 阅读全文
posted @ 2022-03-21 00:06 Theext 阅读(34) 评论(0) 推荐(0) 编辑
摘要:使用局部线性嵌入法(流形降维)对瑞士卷数据集降维 主要步骤流程: 1. 导入包 2. 生成瑞士卷数据集 3. 可视化瑞士卷数据集 4. 不同自变量个数对应的重建误差 5. 可视化LLE降维效果 1. 导入包 In [1]: # 导入包 import numpy as np import matplo 阅读全文
posted @ 2022-03-17 00:14 Theext 阅读(390) 评论(0) 推荐(0) 编辑
摘要:使用LDA对糖尿病数据集降维 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 拆分训练集和测试集 3.4 特征缩放 4. 使用 LDA 降维 4.1 使用 LDA 降维 4.2 验证 X_train_lda 的由来 5. 构建 阅读全文
posted @ 2022-03-17 00:05 Theext 阅读(319) 评论(0) 推荐(0) 编辑
摘要:使用PCA核方法对糖尿病数据集降维 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 拆分训练集和测试集 3.4 特征缩放 4. 使用 Kernel PCA 降维 5. 构建逻辑回归模型 5.1 使用原始数据构建逻辑回归模型 5 阅读全文
posted @ 2022-03-16 23:47 Theext 阅读(464) 评论(0) 推荐(0) 编辑
摘要:使用PCA对糖尿病数据集降维 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 拆分训练集和测试集 3.4 特征缩放 4. 使用PCA降维 4.1 使用 PCA 生成新的自变量 4.2 验证PCA转换规则 4.2.1 打印旧的自 阅读全文
posted @ 2022-03-16 21:46 Theext 阅读(928) 评论(0) 推荐(0) 编辑
摘要:使用包装法对糖尿病数据集降维(递归特征消除法) 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 拆分训练集和测试集 3.4 特征缩放 4. 使用递归特征消除法降维 5. 得到降维后的自变量 数据集链接:https://www. 阅读全文
posted @ 2022-03-16 21:19 Theext 阅读(189) 评论(0) 推荐(0) 编辑
摘要:使用过滤法对糖尿病数据集降维 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 4. 使用不同的统计指标做特征选择 4.1 使用 方差 指标 4.2 使用 卡方检验 指标 5. 构建逻辑回归模型并评估模型性能 5.1 使用原始数据构建 阅读全文
posted @ 2022-03-16 21:10 Theext 阅读(274) 评论(0) 推荐(0) 编辑
摘要:使用DBSCAN对环形数据做聚类 主要步骤流程: 1. 导入包 2. 生成数据并可视化 3. 使用DBSCAN做聚类并可视化 3.1 参数组合1 3.2 参数组合2 3.3 参数组合3 3.4 参数组合4 4. 使用K-Means做聚类并可视化 5. 打印调整兰德指数 1. 导入包 In [2]: 阅读全文
posted @ 2022-03-15 18:50 Theext 阅读(540) 评论(0) 推荐(0) 编辑
摘要:使用轮廓系数评估超市客户分组效果 主要步骤流程: 1. 导入包 2. 导入数据集 3. 使用K-Means算法得到不同K值对应的WCSS4. 使用K-Means算法得到不同K值对应的轮廓系数 3.1 生成WCSS 3.2. 画出 K值 vs WCSS 图 4. 使用K-Means算法得到不同K值对应 阅读全文
posted @ 2022-03-15 18:41 Theext 阅读(912) 评论(0) 推荐(0) 编辑
摘要:使用K-Means对超市客户分组 主要步骤流程: 1. 导入包 2. 导入数据集 3. 使用肘部法则选择最优的K值 4. 使用K=5做聚类 5. 可视化聚类效果 6. 采取措施 7. 瑞士卷生产及其聚类 数据集链接:https://www.heywhale.com/mw/dataset/623069 阅读全文
posted @ 2022-03-15 18:34 Theext 阅读(430) 评论(0) 推荐(0) 编辑
摘要:使用支持向量机预测黑色星期五花销 主要步骤流程: 数据集链接:https://www.cnblogs.com/ojbtospark/p/16005660.html 1. 导入包 In [ ]: # 导入包 import numpy as np import pandas as pd 2. 导入数据集 阅读全文
posted @ 2022-03-15 18:22 Theext 阅读(210) 评论(0) 推荐(0) 编辑
摘要:使用AdaBoost预测黑色星期五花销 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 删除无用的列 3.3 检查类别型变量 3.4 标签编码&独热编码 3.5 得到自变量和因变量 3.6 拆分训练集和测试集 3.7 特征缩放 4. 使用不同的参数 阅读全文
posted @ 2022-03-15 18:06 Theext 阅读(591) 评论(0) 推荐(0) 编辑
摘要:使用随机森林预测德国人信贷风险 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 处理类别型变量 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建随机森林模型 4.1 模型1:构建随机森林模型 4.1 阅读全文
posted @ 2022-03-15 17:33 Theext 阅读(348) 评论(0) 推荐(0) 编辑
摘要:使用决策树预测德国人信贷风险 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 处理类别型变量 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建决策树模型 4.1 模型1:构建决策树模型 4.1.1 阅读全文
posted @ 2022-03-15 17:14 Theext 阅读(277) 评论(0) 推荐(0) 编辑
摘要:基于逻辑回归预测客户是否购买汽车新车型ROC曲线 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理4. 构建逻辑回归模型 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4.构建逻辑回归模型 5. 手工画 阅读全文
posted @ 2022-03-15 17:08 Theext 阅读(274) 评论(0) 推荐(0) 编辑
摘要:基于逻辑回归预测客户是否购买汽车新车型 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建逻辑回归模型 4.1 模型1:构建逻辑回归 阅读全文
posted @ 2022-03-15 17:06 Theext 阅读(247) 评论(0) 推荐(0) 编辑
摘要:基于朴素贝叶斯预测客户是否购买汽车新车型 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 构建朴素贝叶斯模型做预测 4.1 构建模型并训练 4.2 阅读全文
posted @ 2022-03-15 17:01 Theext 阅读(184) 评论(0) 推荐(0) 编辑
摘要:基于KNN预测客户是否购买汽车新车型 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建KNN模型 4.1 模型1:构建KNN模型并 阅读全文
posted @ 2022-03-15 16:58 Theext 阅读(554) 评论(0) 推荐(0) 编辑
摘要:使用LASSO回归根据多个因素预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 标签编码&独热编码 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 构建不同参数的LASSO回归模型 4.1 模型1:构建LASS 阅读全文
posted @ 2022-03-15 16:54 Theext 阅读(779) 评论(0) 推荐(0) 编辑
摘要:使用岭回归根据多个因素预测医疗费用 主要步骤流程: 数据集链接:https://www.cnblogs.com/ojbtospark/p/16005626.html 1. 导入包 In [1]: # 导入包 import numpy as np import pandas as pd import 阅读全文
posted @ 2022-03-15 16:47 Theext 阅读(297) 评论(0) 推荐(0) 编辑
摘要:使用多项式回归根据年龄预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 筛选数据 3.3 得到因变量 3.4 创建自变量 3.5 检验新的自变量和charges的相关性 3.6 拆分训练集和测试集 4. 构建多项式回归模型 4.1 构建模型 阅读全文
posted @ 2022-03-15 16:40 Theext 阅读(310) 评论(0) 推荐(0) 编辑
摘要:使用多元线性回归根据多个因素预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 标签编码&独热编码 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 4. 构建多元线性回归模型 5. 得到模型表达式 6. 预测测试集 7. 得到模型MSE 阅读全文
posted @ 2022-03-15 16:34 Theext 阅读(414) 评论(0) 推荐(0) 编辑
摘要:使用简单线性回归根据年龄预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 筛选数据 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 4. 构建不同参数的简单线性回归模型 4.1 模型1:构建简单线性回归模型 4.1.1 构建简单线性回 阅读全文
posted @ 2022-03-15 16:29 Theext 阅读(325) 评论(0) 推荐(0) 编辑
摘要:预处理黑色星期五数据(熟悉流程,后续文章有进行预测部分) 主要步骤流程: 1. 导入包和数据集 2. 处理缺失数据 3. 特征工程 4. 处理类别型字段 5. 得到自变量和因变量 6. 拆分训练集和测试集 7. 特征缩放 数据集链接:https://www.heywhale.com/mw/datas 阅读全文
posted @ 2022-03-15 16:28 Theext 阅读(116) 评论(0) 推荐(0) 编辑
摘要:起因: 从上大学至今,对大数据日常接触,在校期间伴随着大数据这个名词也走过了三年,碰巧在今天看到了一篇文章(文章大致内容是描述某某高校的今年入学新生的数据,但是文章标题上的“大数据”三个字引起了我的注意,并有所感想),对于现在许多自媒体在写文章时硬是要冠上“大数据”这个词,对于就读数据科学与大数据技 阅读全文
posted @ 2022-03-10 19:40 Theext 阅读(133) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示