摘要: 一、AUC含义 AUC是二分类指标ROC曲线下方的面积,在0~1之间。而在预测结果概率列表中可以理解为负样本排在正样本前面的概率(对概率值列排序)。 二、概率列表 通常建模结果可以输出为包含两列的表,第一列为真实标签(1/0),第二列为预测标签1的概率,示例如下: 三、利用awk计算AUC (1)先 阅读全文
posted @ 2021-04-09 16:58 ly_godc 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 在使用虚拟机时经常会碰到重启之后Xshell中连不上的情况,这个时候进入虚拟机的终端使用ifconfig查看时会发现,我们设置的静态IP地址消失,这个时候就需要重启网卡,如下: 第一步: 关闭NetworkManager,原因是RedHat自己开发的NetworkManager管理工具和/etc/s 阅读全文
posted @ 2020-08-20 16:47 ly_godc 阅读(1172) 评论(0) 推荐(0) 编辑
摘要: 在做深度学习的时候,我们首先会用到python PIL模块中的convert函数将原始图片(例如png)转化为对应的像素值,再将像素值转化成tensor之后进行模型的训练。 1、安装PIL 1 pip install pillow 2 3 conda install pillow 2、使用方式 1 阅读全文
posted @ 2020-03-27 11:21 ly_godc 阅读(9746) 评论(0) 推荐(0) 编辑
摘要: 1.数据归一化的目的 数据归一化的目的,就是将数据的所有特征都映射到同一尺度上,这样可以避免由于量纲的不同使数据的某些特征形成主导作用。 2.数据归一化的方式 (1)最值归一化 特点: 可以将所有数据都映射到0-1之间,它适用于数据分布有明显边界的情况,容易受到异常值的影响,异常值会造成数据的整体偏 阅读全文
posted @ 2019-11-13 15:19 ly_godc 阅读(551) 评论(0) 推荐(0) 编辑
摘要: 一、首先了解混淆矩阵中的四个值对应的意思: True Positive(真正,TP):将正类预测为正类数 True Negative(真负,TN):将负类预测为负类数 False Positive(假正,FP):将负类预测为正类数误报 (Type I error) False Negative(假负 阅读全文
posted @ 2019-10-14 14:07 ly_godc 阅读(1157) 评论(1) 推荐(0) 编辑
摘要: 生物信息分析中会用到很多的比对软件,比较常用的有bowtie、bowtie2、bwa等,比对文件的标准格式是sam格式,但是bowtie比对默认输出的格式却不是sam格式,由于bowtie适用于短序列比对,并且看突变碱基比较方便,因此它的默认输出格式还是有一定优势的,下面就来说明一下它的默认输出格式 阅读全文
posted @ 2019-05-10 13:12 ly_godc 阅读(2878) 评论(1) 推荐(0) 编辑
摘要: 在生信分析中,常常在服务器上安装了R之后,在运行R画图脚本的时候会出现这样的报错: 阅读全文
posted @ 2019-03-11 18:08 ly_godc 阅读(6652) 评论(0) 推荐(0) 编辑
摘要: 环境说明: 该系统第一次安装mysql。 自己指定安装目录,指定数据文件目录。 linux系统版本: CentOS 7.3 64位 安装源文件版本:mysql-5.7版本 mysql安装位置:/software/mysql 数据库文件数据位置:/data/mysql 注:未防止混淆,这里都用绝对路径 阅读全文
posted @ 2018-12-28 16:53 ly_godc 阅读(313) 评论(0) 推荐(0) 编辑
摘要: 在生物信息分析中,经常会遇到这种情况,当数据量过大的时候会超出我们服务器的最大资源配置,导致有些软件或者我们自己写的脚本执行不过去,这时我们通常使用的办法就是将输入文件拆成很多份去依次执行,最终将结果文件合并。虽然使用python等语言可以实现拆分文件,但是既然已经有了轮子,我们就没必要去造了,这时 阅读全文
posted @ 2018-10-30 17:52 ly_godc 阅读(28991) 评论(0) 推荐(1) 编辑
摘要: grep的使用:一、grep一般格式: grep [选项] 基本正则表达式 [文件] 这里的正则表达式可以为字符串。在grep命令中输入字符串参数时,最好将其用双引号括起来。调用变量时也可以使用双引号。在调用模式匹配时,应使用单引号。 二、grep常用选项: -c 只输出匹配行的计数。 -i 不区分 阅读全文
posted @ 2018-03-21 11:14 ly_godc 阅读(523) 评论(0) 推荐(0) 编辑