03 2020 档案

摘要:简介 Atom 是 Github 开源的文本编辑器,相当于半个IDE。其特点如下: (1)免费开源,多平台支持(Windows、Mac、Linux); (2)界面美观、现代化,使用舒适; (3)多文件管理(文件树列表功能); (4)设置管理很方便,不用像Sublime需要自己手动安装第三方管理插件; 阅读全文
posted @ 2020-03-31 11:04 生物信息与育种 阅读(419) 评论(0) 推荐(0) 编辑
摘要:最近打算开始写一个多组学(包括宏基因组/16S/转录组/蛋白组/代谢组)关联分析的R包,避免重复造轮子,在开始之前随便在网上调研了下目前已有的R包工具,部分罗列如下: 1. mixOmics 应该是在多组学领域知名度最高的一个R包,有专门的团队,做了十余年了,引用量也比较高。 官网: "http:/ 阅读全文
posted @ 2020-03-30 13:01 生物信息与育种 阅读(8573) 评论(0) 推荐(0) 编辑
摘要:华大的春季培训课程之一: "人类群体基因组学研究进展和策略" ,很好的扫盲课程(侵删)。 阅读全文
posted @ 2020-03-29 14:36 生物信息与育种 阅读(599) 评论(0) 推荐(0) 编辑
摘要:华大的春季培训课程之一: "https://ke.qq.com/course/1128997?taid=7160092735650341" ,我认为讲得很好,介绍全面而详细,加了一些个人经验(侵删)。 流程众多,对于结果会有一些差异,尤其是对低频变异。如果很关注低频位点,可多种几款流程比较。 实际上 阅读全文
posted @ 2020-03-28 23:49 生物信息与育种 阅读(1324) 评论(0) 推荐(0) 编辑
摘要:[toc] 这个需求还是很常见的,因为我们在处理数据的时候无法全面考虑到数据框中含有哪些类型的数据,比如含有NA、NaN或Inf,甚至是一些乱七八糟的字符串。这时不论做统计分析还是作图,都会带来意想不到的错误。为防止这种现象发生,有必要在分析数据前将这些含有特殊字符的行去掉。 1. 去掉指定列中包含 阅读全文
posted @ 2020-03-27 14:20 生物信息与育种 阅读(7699) 评论(0) 推荐(0) 编辑
摘要:WGS/WES Mapping to Variant Calls Version 1.0 "htslib" 官网上给的一个 "WGS/WES的流程" 。关于htslib、samtools和bcftools之间的关系,可以在 "sanger官网" 查看其解释: HTSlib is a software 阅读全文
posted @ 2020-03-27 10:26 生物信息与育种 阅读(415) 评论(0) 推荐(0) 编辑
摘要:推荐R语言界的国内大佬于淼写的代谢组学workflow,包含了大部分代谢组学(以及暴露组)的数据分析方法。 "Meta Workflow" 主要内容包括: Sample collection Pretreatment Principles of metabolomics data analysis 阅读全文
posted @ 2020-03-23 10:36 生物信息与育种 阅读(589) 评论(0) 推荐(1) 编辑
摘要:宏蛋白质组数据分析相对较难,不同于常规蛋白质组分析,因为数据库太大,无法直接进行搜库匹配,需要对数据库进行优化。整理了几个发表的宏蛋白搜库分析工具。具体效果如何,还需要测试。 1.ProteoStorm 发表: "ProteoStorm: An Ultrafast Metaproteomics Da 阅读全文
posted @ 2020-03-19 23:00 生物信息与育种 阅读(1602) 评论(0) 推荐(0) 编辑
摘要:原理 Git 命令很多,但日常使用只要记住下图的6个主要命令,就可以了。 工作区(Working Directory) 在git管理下的正常目录都算是工作区。就是你平时存放项目代码的地方。 暂存区(Stage/Index) 暂存区,用于临时存放你的改动,事实上它只是一个文件,保存即将提交到文件列表信 阅读全文
posted @ 2020-03-18 18:01 生物信息与育种 阅读(205) 评论(0) 推荐(0) 编辑
摘要:当我们测完序拿到原始数据之后,第一件事肯定是进行rawdata进行过滤。质控过滤软件如fastqc、multiQC、trimmomatic等。 得到基因组的clean reads后,无非两件事,一是denovo组装,构建参考序列;二是重测序,分析变异及后续基因表达定量、功能等下游分析。 1. 基因组 阅读全文
posted @ 2020-03-16 18:11 生物信息与育种 阅读(2980) 评论(0) 推荐(0) 编辑
摘要:Google的chrome莫名其妙突然所有页面都显示“喔唷 崩溃啦”,各种插件在右下角弹出报错!这个问题我之前遇到过一次,后来通过改快捷方式的名字解决了。可是这次,隔离回来上班,打开电脑,又一次出现这种现象。折腾了一上午,各种方法都试过了,最后终于解决了。 尝试失败的方法 网上虽然有很多回答,但历史 阅读全文
posted @ 2020-03-16 11:57 生物信息与育种 阅读(19251) 评论(2) 推荐(2) 编辑
摘要:官方文档: "https://biognosys.com/media.ashx/spectronautmanual.pdf" 0. 准备 Spectronaut软件是蛋白组DIA分析最常用的谱图解析软件之一,优点是定量准确,缺点是高额收费,window版本,速度慢。一起来简单了解下用法。 这是它的界 阅读全文
posted @ 2020-03-12 16:11 生物信息与育种 阅读(7462) 评论(2) 推荐(0) 编辑
摘要:概念 利用蛋白质组学数据,结合基因组数据(DNA)、转录组数据(RNA)来研究基因组注释问题,被称为蛋白质基因组学。“蛋白质基因组学”一词由Jaffe 等于2004 年首次提出,作者采用串联质谱数据匹配DNA翻译得到氨基酸序列的方法,在仅有810 kb 大小的细菌基因组上直接鉴定开放阅读框(open 阅读全文
posted @ 2020-03-09 22:49 生物信息与育种 阅读(3679) 评论(0) 推荐(0) 编辑
摘要:众所周知, "Proteowizard MSconvert" 用于质谱原始数据的格式转换,但主要平台是windows,要想在Linux上运行需要打Docker或Wine,对于普通用户来说还是很困难的,想想质谱的数据动辄上百Gb要进行转换相当麻烦。 比利时根特大学Dr. Lennart Martens 阅读全文
posted @ 2020-03-09 22:48 生物信息与育种 阅读(5866) 评论(0) 推荐(0) 编辑
摘要:最近读取一个数据时,报如标题的错误。 这是因为select函数对于有重复列名的数据框,选择不了。(即使不选择重复的列也会报此错误)。 可以用以下脚本查下重复的列名: 发现有两个Protein_ID的列。 如何解决呢?可改用readr读取,会智能解析。 all % dplyr::select(Prot 阅读全文
posted @ 2020-03-09 22:46 生物信息与育种 阅读(613) 评论(0) 推荐(0) 编辑
摘要:`bash shell`脚本语法怪异,其他语言循环写入数组或列表都很简单实现,或有相应函数来做。 以下用两种方法来实现: 方法一 c=0 for i in ;do pre= filelist[$c]="$pre" ((c++)) done echo $c for i in ${filelist[@] 阅读全文
posted @ 2020-03-09 22:44 生物信息与育种 阅读(4196) 评论(0) 推荐(0) 编辑
摘要:tmux(terminal multiplexer) 是Linux上的终端复用神器。 1. 安装 (1)下载 下载及其依赖软件。 (2)安装 先安装依赖,再安装tmux。 (3)设置环境 设置环境变量。 2. 常用命令使用 tmux的结构包括 会话(session)、窗口(window)、窗格(pa 阅读全文
posted @ 2020-03-09 22:39 生物信息与育种 阅读(4559) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示