2023 年 3月 10 日随笔档案 - 海_纳百川

2023年3月10日

摘要：总的来说,导致该问题出现的原因有以下几个数据不平衡：如果训练数据中两个类别的样本数量不平衡，例如一个类别的样本数量比另一个类别少很多，那么模型可能会倾向于预测数量较多的类别。可以通过一些方法来解决数据不平衡问题，例如欠采样、过采样或者生成合成样本等方式。特征选择：选择具有良好区分能力的特征对于提阅读全文

posted @ 2023-03-10 17:17 海_纳百川阅读(228) 评论(0) 推荐(0) 编辑

numpy数组中根据判定条件提取索引位置

摘要：要求: 我有两个numpy类型的数组，第一个维度都是相同的，其中一个数组中都是0或者1，如果是1，则将两一个数组中的相同位置提取出来形成一个新的numpy数组可以使用numpy的boolean indexing功能来完成此操作。假设第一个数组为arr1，第二个数组为arr2，可以使用如下代码来提取阅读全文

posted @ 2023-03-10 16:36 海_纳百川阅读(96) 评论(0) 推荐(0) 编辑

python中同时执行多个子命令

摘要：在Python中，可以使用subprocess模块来同时执行多个系统命令，并获取输出 import subprocess # 执行的三个系统命令 cmd1 = 'echo "Hello World"' cmd2 = 'ls -l' cmd3 = 'pwd' # 同时执行三个系统命令 processe 阅读全文

posted @ 2023-03-10 16:30 海_纳百川阅读(1105) 评论(0) 推荐(0) 编辑

python根据当前时间创建文件夹

摘要：若想在文件夹名称中包含小时、分钟和秒，可以将时间格式化字符串修改为 "%Y-%m-%d-%H-%M-%S"。下面是示例代码： import os from datetime import datetime # 获取当前时间 now = datetime.now() # 格式化时间字符串，作为文件夹名阅读全文

posted @ 2023-03-10 16:25 海_纳百川阅读(559) 评论(0) 推荐(0) 编辑

关于sklearn中StandardScaler的使用方式

摘要：在机器学习中经常会使用StandardScaler进行数据归一化，注意一旦调整好StandardScaler以后就保存下来，后面如果进行测试单个时，可以进行加载并对其进行标准化 StandardScaler 是一种常用的数据标准化方法，用于将数据转换为均值为 0，标准差为 1 的标准正态分布。标准阅读全文

posted @ 2023-03-10 15:48 海_纳百川阅读(2352) 评论(0) 推荐(0) 编辑

linux中将管道命令输出的数值全部加起来

摘要： your_command | awk '{ sum += $1 } END { print sum }' 其中，your_command 是你要执行的管道命令。在这个命令中，管道符 | 将前一个命令的输出传递给了后一个命令。 awk 命令将每个输出行的第一个字段（默认情况下是以空格作为分隔符的第一个阅读全文

posted @ 2023-03-10 15:18 海_纳百川阅读(67) 评论(0) 推荐(0) 编辑

后台执行python程序，并将输出保存为log

摘要： nohup python your_script.py > your_log_file.log 2>&1 & 其中，your_script.py 是你要执行的 Python 程序，your_log_file.log 是要保存输出的日志文件名。 nohup 命令用于使程序在后台运行，并且不会受到终端关阅读全文

posted @ 2023-03-10 15:15 海_纳百川阅读(952) 评论(0) 推荐(0) 编辑

不积跬步无以至千里

研究领域：深度学习，图像处理
联系方式：vladimirputin@foxmail.com
不必高看自己，也不必贬低自己

公告

不积跬步无以至千里

研究领域：深度学习，图像处理 联系方式：vladimirputin@foxmail.com 不必高看自己，也不必贬低自己

公告

研究领域：深度学习，图像处理
联系方式：vladimirputin@foxmail.com
不必高看自己，也不必贬低自己