摘要: 1、grep 1 ## a为一个data frame,取含有RNA-Seq的行 2 index <- grep("RNA-Seq", a$Assay_Type) 3 b <- a[index,] 2、读取文件,选择不读哪一行 1 ##不读取带有!的行 2 data <- read.table("fi 阅读全文
posted @ 2020-02-06 15:42 斩毛毛 阅读(550) 评论(0) 推荐(0) 编辑
摘要: (1):字典中,get的用法 若该值无value,缺省值可随意设定。。。。如:d[color] = d.get(color, "hi") (2)sorted 用于排序,可形成副本 lis = ["red", "blue", "pep", "yellow"] print(sorted(lis, key 阅读全文
posted @ 2018-10-31 20:54 斩毛毛 阅读(289) 评论(0) 推荐(0) 编辑
摘要: 安装:install.packages("ggplot2") 加载:library(ggplot2) Plot(图)= data(数据集)+ Aesthetics(美学映射)+ Geometry(几何对象) 其中: data: 数据集,主要是data frame; Aesthetics: 美学映射, 阅读全文
posted @ 2018-08-07 13:48 斩毛毛 阅读(1200) 评论(0) 推荐(0) 编辑
摘要: 1、Linux下去掉^M的方法 ①dos2unix filename ②sed -i 's/^M//g' filename #注意:^M的输入方式是 Ctrl + v ,然后Ctrl + M 或者 替换, s/\r/\r/g 2、sort 功能说明:将文本文件内容进行排序 语 法:sort [-nk 阅读全文
posted @ 2018-07-11 17:33 斩毛毛 阅读(437) 评论(0) 推荐(0) 编辑
摘要: VCF2Dis,是一款计算根据vcf文件计算距离矩阵的小工具 1 安装 下载后 tar -zxvf VCF2DisXXX.tar.gz cd VCF2DisXXX make # 添加环境变量即可 2 示例文件进行简单使用 Usage: VCF2Dis -i <in.vcf> -o <p_dis.ma 阅读全文
posted @ 2021-04-05 16:32 斩毛毛 阅读(1005) 评论(0) 推荐(0) 编辑
摘要: NextPolish由未来组开发对基因组序列进行polish的工具,对三代以及二代均可进行polish。 gituhp地址:https://github.com/Nextomics/NextPolish 基因组进行de novo组装后,得到contig,必须使用三代(尤其是没有consensus,比 阅读全文
posted @ 2021-02-08 11:11 斩毛毛 阅读(1449) 评论(0) 推荐(2) 编辑
摘要: distmat 可用于计算遗传距离,得到距离矩阵 1 在线运算 可通过在线进行遗传距离的计算,网址:http://www.bioinformatics.nl/cgi-bin/emboss/distmat 输入的文件为比对文件,可以在上述网站看示例即可。 选择模型后,进行运算 而后得到如下的距离矩阵 阅读全文
posted @ 2021-02-02 21:49 斩毛毛 阅读(1306) 评论(0) 推荐(0) 编辑
摘要: 就基因家族工作做一简单介绍 基本思路 数据准备 确定好研究的基因家族后(比如:NBS,MADS-box etc.),下面就可以下载相关数据。 所研究物种的基因组序列; genome.fa 所研究物种蛋白序列;pep.fa 所研究物种gff文件 目标基因家族的隐马科夫模型 or RefSeq 对应基因 阅读全文
posted @ 2021-01-31 13:53 斩毛毛 阅读(2950) 评论(0) 推荐(0) 编辑
摘要: tructure是与PCA、进化树相似的方法,就是利用分子标记的基因型信息对一组样本进行分类,分子标记可以是SNP、indel、SSR。相比于PCA,进化树,群体结构分析可明确各个群之间是否存在交流及交流程度 1 软件安装 conda install -c bioconda admixture ad 阅读全文
posted @ 2021-01-30 14:55 斩毛毛 阅读(2711) 评论(0) 推荐(0) 编辑
摘要: mVISTA可对2个或者多个DNA序列进行比较,可以对比对结果进行可视化。 详情请大力戳这里 0 输入文件说明 mVISTA 需要输入的文件有如下几类 必须文件 邮箱 fasta格式序列文件(或者GENBANK identifier) 上传文件不得> 10 Mb 可选文件 比对程序 (一般选第3个即 阅读全文
posted @ 2021-01-26 09:41 斩毛毛 阅读(2311) 评论(0) 推荐(0) 编辑
摘要: Assemblytics, 发表在Bioinformaticshttp://www.ncbi.nlm.nih.gov/pubmed/27318204,鉴定基因组间SV。 Githup,https://github.com/marianattestad/assemblytics 同时也可以在线使用,h 阅读全文
posted @ 2021-01-25 13:11 斩毛毛 阅读(1182) 评论(0) 推荐(0) 编辑
摘要: 本文学习费章军老师文章Genome of Solanum pimpinellifolium provides insights into structural variants during tomato breeding 如何鉴定SV。 其流程见 https://github.com/GaoLei 阅读全文
posted @ 2021-01-25 13:10 斩毛毛 阅读(1040) 评论(0) 推荐(0) 编辑
摘要: 与核基因组相比,细胞器基因组相对来说,更为保守,并且序列较短,更加易于组装,仅仅根据二代测序reads即可进行组装。 下面简单介绍我在本项目中的方法,仅供参考。 1 数据 本次我使用的二代数据为50X。下机后,首先通过fastq对其进行过滤,改软件操作较为简单,仅仅使用-q 20进行过滤,得到cle 阅读全文
posted @ 2021-01-25 13:09 斩毛毛 阅读(1804) 评论(1) 推荐(0) 编辑
摘要: REPuter可注释叶绿体重复序列,包括4种类型,Forward(F), Reverse (R), Complement (C), Palindromic (P)。 REPuter 是可在线注释, 详情可戳参考文献、 Robert* REPuter: The Manifold Application 阅读全文
posted @ 2021-01-25 13:08 斩毛毛 阅读(2112) 评论(0) 推荐(0) 编辑