摘要: 最近寒假在家学习MySQL,跟着名叫“秃头统治世界”的up主,有七天的课程。把每天的学习知识在此整理回顾一下,争取自己真能七天看完视频。 一、数据库的下载,安装与连接 1. 下载 下载网址:http://dev.mysql.com/downloads/mysql/ 2. 安装(两种方法) 2.1 下 阅读全文
posted @ 2021-02-09 22:02 不知天高地厚的小可爱 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 网格搜索 1. 网格搜索(Grid Search)就是你手动的给出一个模型中你想要改动的参数,程序自动的帮你使用穷举法来将所用的参数都运行一遍。决策树中我们常常将最大树深作为需要调节的参数;AdaBoost中将弱分类器的数量作为需要调节的参数。 2. 参数调优:为了确定最优搜索参数,需要选择一个评分 阅读全文
posted @ 2021-02-03 15:01 不知天高地厚的小可爱 阅读(860) 评论(0) 推荐(0) 编辑
摘要: 参数模型 1. 参数作为模型从历史训练数据中学到的一部分,是机器学习算法的关键。 (1)统计学中的“参数”: 在统计学中,你可以假设一个变量的分布,比如高斯分布。高斯分布的两个参数分别是平均值(μ)和标准差(sigma)。这在机器学习中是有效的,其中这些参数可以用数据估计得到并用作预测模型的一部分。 阅读全文
posted @ 2021-02-02 10:38 不知天高地厚的小可爱 阅读(1542) 评论(0) 推荐(0) 编辑
摘要: enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。 使用语法: enumerate(sequence, [start =0] ) 例子: seasons = ['Spring', 'Summer', 阅读全文
posted @ 2021-01-31 19:55 不知天高地厚的小可爱 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 1. lambda语法 lambda argument_list: expression lambda是Python预留的关键字,argument_list(参数列表)和expression(关于参数的表达式)由用户自定义。 2. lambda使用简单示例 lambda x, y: x*y;函数输入 阅读全文
posted @ 2021-01-29 11:35 不知天高地厚的小可爱 阅读(8304) 评论(0) 推荐(0) 编辑
摘要: python在线安装库时会较慢,那是因为python的默认镜像源在国外,因此会慢;而国内有很多可以用的python镜像源,将python镜像源更改为国内的,则可以大大加快python库的安装速度。 1.Python镜像源集合 阿里云 http://mirrors.aliyun.com/pypi/si 阅读全文
posted @ 2021-01-27 23:23 不知天高地厚的小可爱 阅读(1150) 评论(0) 推荐(0) 编辑
摘要: KFold划分数据集的原理:根据n_split直接进行划分 StratifiedKFold划分数据集的原理:划分后的训练集和验证集中类别分布尽量和原数据集一样 #导入相关packages from sklearn.model_selection import KFold from sklearn.m 阅读全文
posted @ 2021-01-26 22:41 不知天高地厚的小可爱 阅读(756) 评论(0) 推荐(0) 编辑
摘要: 在显示数据框时添加以下代码 #显示所有列 pd.set_option('display.max_columns', None) #显示所有行 pd.set_option('display.max_rows', None) #设置value的显示长度为100,默认为50 pd.set_option(' 阅读全文
posted @ 2021-01-25 21:29 不知天高地厚的小可爱 阅读(611) 评论(0) 推荐(0) 编辑
摘要: 参考文献 所谓的不平衡数据集指的是数据集各个类别的样本量极不均衡。以二分类问题为例,假设正类的样本数量远大于负类的样本数量,通常情况下通常情况下把多数类样本的比例接近100:1这种情况下的数据称为不平衡数据。不平衡数据的学习即需要在分布不均匀的数据集中学习到有用的信息。 本文主要介绍从数据角度出发的 阅读全文
posted @ 2021-01-21 23:40 不知天高地厚的小可爱 阅读(1550) 评论(0) 推荐(0) 编辑
摘要: 分离训练集测试集 from sklearn.model_selection import train_test_split eg: X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_sta 阅读全文
posted @ 2020-10-13 17:14 不知天高地厚的小可爱 阅读(818) 评论(0) 推荐(0) 编辑
1