上一页 1 ··· 44 45 46 47 48 49 50 51 52 ··· 61 下一页
摘要: [toc] 这个需求还是很常见的,因为我们在处理数据的时候无法全面考虑到数据框中含有哪些类型的数据,比如含有NA、NaN或Inf,甚至是一些乱七八糟的字符串。这时不论做统计分析还是作图,都会带来意想不到的错误。为防止这种现象发生,有必要在分析数据前将这些含有特殊字符的行去掉。 1. 去掉指定列中包含 阅读全文
posted @ 2020-03-27 14:20 生物信息与育种 阅读(7216) 评论(0) 推荐(0) 编辑
摘要: WGS/WES Mapping to Variant Calls Version 1.0 "htslib" 官网上给的一个 "WGS/WES的流程" 。关于htslib、samtools和bcftools之间的关系,可以在 "sanger官网" 查看其解释: HTSlib is a software 阅读全文
posted @ 2020-03-27 10:26 生物信息与育种 阅读(400) 评论(0) 推荐(0) 编辑
摘要: 推荐R语言界的国内大佬于淼写的代谢组学workflow,包含了大部分代谢组学(以及暴露组)的数据分析方法。 "Meta Workflow" 主要内容包括: Sample collection Pretreatment Principles of metabolomics data analysis 阅读全文
posted @ 2020-03-23 10:36 生物信息与育种 阅读(570) 评论(0) 推荐(1) 编辑
摘要: 宏蛋白质组数据分析相对较难,不同于常规蛋白质组分析,因为数据库太大,无法直接进行搜库匹配,需要对数据库进行优化。整理了几个发表的宏蛋白搜库分析工具。具体效果如何,还需要测试。 1.ProteoStorm 发表: "ProteoStorm: An Ultrafast Metaproteomics Da 阅读全文
posted @ 2020-03-19 23:00 生物信息与育种 阅读(1521) 评论(0) 推荐(0) 编辑
摘要: 当我们测完序拿到原始数据之后,第一件事肯定是进行rawdata进行过滤。质控过滤软件如fastqc、multiQC、trimmomatic等。 得到基因组的clean reads后,无非两件事,一是denovo组装,构建参考序列;二是重测序,分析变异及后续基因表达定量、功能等下游分析。 1. 基因组 阅读全文
posted @ 2020-03-16 18:11 生物信息与育种 阅读(2933) 评论(0) 推荐(0) 编辑
摘要: Google的chrome莫名其妙突然所有页面都显示“喔唷 崩溃啦”,各种插件在右下角弹出报错!这个问题我之前遇到过一次,后来通过改快捷方式的名字解决了。可是这次,隔离回来上班,打开电脑,又一次出现这种现象。折腾了一上午,各种方法都试过了,最后终于解决了。 尝试失败的方法 网上虽然有很多回答,但历史 阅读全文
posted @ 2020-03-16 11:57 生物信息与育种 阅读(18620) 评论(2) 推荐(2) 编辑
摘要: 官方文档: "https://biognosys.com/media.ashx/spectronautmanual.pdf" 0. 准备 Spectronaut软件是蛋白组DIA分析最常用的谱图解析软件之一,优点是定量准确,缺点是高额收费,window版本,速度慢。一起来简单了解下用法。 这是它的界 阅读全文
posted @ 2020-03-12 16:11 生物信息与育种 阅读(6256) 评论(2) 推荐(0) 编辑
摘要: 概念 利用蛋白质组学数据,结合基因组数据(DNA)、转录组数据(RNA)来研究基因组注释问题,被称为蛋白质基因组学。“蛋白质基因组学”一词由Jaffe 等于2004 年首次提出,作者采用串联质谱数据匹配DNA翻译得到氨基酸序列的方法,在仅有810 kb 大小的细菌基因组上直接鉴定开放阅读框(open 阅读全文
posted @ 2020-03-09 22:49 生物信息与育种 阅读(3351) 评论(0) 推荐(0) 编辑
摘要: 众所周知, "Proteowizard MSconvert" 用于质谱原始数据的格式转换,但主要平台是windows,要想在Linux上运行需要打Docker或Wine,对于普通用户来说还是很困难的,想想质谱的数据动辄上百Gb要进行转换相当麻烦。 比利时根特大学Dr. Lennart Martens 阅读全文
posted @ 2020-03-09 22:48 生物信息与育种 阅读(5368) 评论(0) 推荐(0) 编辑
摘要: 最近读取一个数据时,报如标题的错误。 这是因为select函数对于有重复列名的数据框,选择不了。(即使不选择重复的列也会报此错误)。 可以用以下脚本查下重复的列名: 发现有两个Protein_ID的列。 如何解决呢?可改用readr读取,会智能解析。 all % dplyr::select(Prot 阅读全文
posted @ 2020-03-09 22:46 生物信息与育种 阅读(595) 评论(0) 推荐(0) 编辑
上一页 1 ··· 44 45 46 47 48 49 50 51 52 ··· 61 下一页