随笔分类 -  机器学习算法

摘要:1.AttributeError: module 'torch' has no attribute '_six'报错: 答:指的是安装的pytorch版本里面没有_six.py文件,因为在pytorch2.0版本以后不在具有此文件。 2.两个解决方法 答:①将2.0版本以前的_six.py文件复制到 阅读全文
posted @ 2024-01-03 09:55 许个未来— 阅读(1879) 评论(0) 推荐(0) 编辑
摘要:1.首先我们要知道中值滤波是什么? 首先,中值滤波对于图片来说的一个降噪操作,此处讲解矩阵已经拉平为一维的情况。(具体含义后续在下一个图片中值中解释,此处例子为一个数组) 2.中值滤波核心是什么?具体是怎么进行的? 中值滤波会设定一个窗口值,也就是在滑动窗口的时候,窗口大小。那么这个中值是怎么进行的 阅读全文
posted @ 2023-10-20 16:50 许个未来— 阅读(418) 评论(0) 推荐(0) 编辑
摘要:1.很多开发需求的时候,会需要不同版本的python,比如说pytorch的时候需要3.9以及对应的版本,某个需求指定3.8版本,所以现在拥有很多个python,但是又不统一相应的库。 2.步骤: ①如何查看自己默认版本 在命令行(Win+R)的情况直接python --version ②如何调用某 阅读全文
posted @ 2023-08-16 10:09 许个未来— 阅读(1016) 评论(0) 推荐(0) 编辑
摘要:因为每次换源都找不到,都要现查及其不方便,特此写个汇总的。——【持续更新,现在时间2023.08.02 14:49】 1.Python安装软件包 通常使用pip install xx -i https://xxxxx 清华大学:https://pypi.tuna.tsinghua.edu.cn/si 阅读全文
posted @ 2023-08-02 11:37 许个未来— 阅读(347) 评论(0) 推荐(0) 编辑
摘要:1.关于这个读取csv文件到指定行,目前想了两个方法。 1.直接with open 文件 一行一行读,读到我们所需要的行返回。但是如果这个文件又需要用pandas处理,就会显得很麻烦,造成二次打开。如果只是单纯读取某一个文件的话,不需要进行数据集的处理,可以使用这种方式,因为是直接打开文件读。 2. 阅读全文
posted @ 2022-12-16 17:16 许个未来— 阅读(552) 评论(0) 推荐(0) 编辑
摘要:1.pd.[col_name].value_counts() 多个值 2.pd.[col_name == key].sum() 单个值 阅读全文
posted @ 2022-12-16 16:29 许个未来— 阅读(99) 评论(0) 推荐(0) 编辑
摘要:1.numpy中的where函数是一个具有条件的真假语句(有点类似if三元表达)。 简单讲,就是判断条件是否为真,为真执行一个条件,为假执行一个条件。 where函数相关官网:https://numpy.org/doc/stable/reference/generated/numpy.where.h 阅读全文
posted @ 2022-11-29 14:43 许个未来— 阅读(569) 评论(0) 推荐(0) 编辑
摘要:1.在matplotlib中画散点图的时候,有个参数s:s指的是画图时散点的大小,数值越大,点的大小越大。(点的图标类型可更改-待补充) 阅读全文
posted @ 2022-11-29 09:45 许个未来— 阅读(86) 评论(0) 推荐(0) 编辑
摘要:1.ROC曲线是什么? ROC 曲线是英文“receiver operating characteristic curve”的简称,对应的中文含义是“受试者工作特征曲线”。简单讲就是对不同的阈值形成混淆矩阵,从而连点成线。 2.举例说明 N 为真实的负类样本数量,P 表示真实的正类样本数量。 有10 阅读全文
posted @ 2022-10-21 14:21 许个未来— 阅读(259) 评论(0) 推荐(0) 编辑
摘要:1.什么是TF-IDF? TF =(某词在文档中出现的次数/文档的总词量) IDF= log e为底(语料库中文档总数/包含该词的文档数+1), +1的原因是避免分母为0 (也被称为逆文档频率,因为是总数除以包含文档数) TF-IDF = TFxIDF TF-IDF值越大表示该特征词对这个文本的重要 阅读全文
posted @ 2022-10-21 10:55 许个未来— 阅读(1550) 评论(0) 推荐(0) 编辑
摘要:字典类型和CountVectorizer文本类型的特征基本相同,不同的是输出的结果类型,字典直接返回的键值对。 以下代码用jupyter分块运行 运行结果含义参考上一篇:https://www.cnblogs.com/future-panda/p/16809957.html 1 from sklea 阅读全文
posted @ 2022-10-20 15:43 许个未来— 阅读(61) 评论(0) 推荐(0) 编辑
摘要:CountVectorizer是文本特征提取的一种方式:本文为稀疏矩阵具体含义 其中new_data所输出的值用toarray()可以转化为稀疏矩阵 new_data.shape():输出的是稀疏矩阵的维度(列表长度X词典个数) 阅读全文
posted @ 2022-10-20 15:04 许个未来— 阅读(536) 评论(0) 推荐(0) 编辑
摘要:训练集和测试集的划分 Ytrain:指的是缺失值那行所对应的有值的部分 Ytest:指的是缺失值,需要预测的部分(一般的监督学习不会预测Ytest,因为我们是预测该缺失的数据,所以Ytest不用做比较,直接进行预测填补缺失值) Xtrain:指的是未缺失部分所对应的特征值 Xtest:指的是缺失部分 阅读全文
posted @ 2022-10-20 09:55 许个未来— 阅读(438) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示