Life·Intelligence

2017年1月16日

摘要：读文献时发现自己逻辑思考能力太差，想起了以前学过的科研的基本思路：观察、假设、证明、验证。看到了一个系列的很好的博文：戴世强 - 谈科研方法不要成为”操作工“！！！慢慢看，慢慢总结~ 阅读全文

posted @ 2017-01-16 17:14 Life·Intelligence 阅读(860) 评论(0) 推荐(0)

摘要：想发好文章？先看好文献！生物信息分析类的文章都有着比较明显的套路，如果你深刻的掌握了这些套路，相信有一天你也能发Nature(子刊)。 Extremotolerant tardigrade genome and improved radiotolerance of human cultured cells by tardigrade-unique protein 先了解基本背景：水熊虫... 阅读全文

posted @ 2017-01-16 16:26 Life·Intelligence 阅读(1209) 评论(0) 推荐(0)

表达谱(DGE)测序与转录组测序的差别

摘要： DGE-seq和普通的transcriptomic profiling相比较有什么不同，有什么特点？ DGE就是用酶将mRNA切断，只使用靠近poly A的一小段RNA去测序。 #1 由于不是测定mRNA的全长，DGE的数据量比转录组要小一些； #2 DGE比转录组价格低一些； #3 DGE和转录组都可以分析所有基因的表达丰度，并且比较组间基因表达差异； #4... 阅读全文

posted @ 2017-01-16 12:40 Life·Intelligence 阅读(8716) 评论(0) 推荐(0)

2017年1月14日

单细胞测序

摘要：刚看了下分子生物学的教材，里面详细讲到了细胞学说，细胞是结构和功能的基本单位，于是我就想到了单细胞测序，这么一来从测序技术出现时，理论上单细胞测序就是可行的，只是到了近些年才真正有能力开展单细胞测序。待续~ 阅读全文

posted @ 2017-01-14 17:31 Life·Intelligence 阅读(654) 评论(0) 推荐(0)

SGE：qsub/qstat/qdel/qhost 任务投递和监控

摘要：参考： Oracle Grid Engine qsub命令 SGE - qsub使用范例 SGE作业基本用法 qsub是最为稳定的底层任务投递系统，就是把一个脚本投递到集群的计算节点上运行。注意，只有登录节点才有资格投递任务，计算节点没有权限投递任务，只能执行，所以千万不要在投递的脚本内嵌套投递，会报错的。下面是我最为常用的投递命令： qsub -cwd -l vf=5g... 阅读全文

posted @ 2017-01-14 17:26 Life·Intelligence 阅读(7236) 评论(0) 推荐(1)

2017年1月11日

统计分布汇总 | 生物信息学应用 | R代码 | Univariate distribution relationships

摘要：最初是看到这个网站，决心把所有统计分布梳理一遍：Univariate distribution relationships - WM 伯努里分布 | Bernoulli distribution 二项分布 | Binomial distribution Βeta分布 | beta distribut 阅读全文

posted @ 2017-01-11 21:08 Life·Intelligence 阅读(4946) 评论(0) 推荐(2)

2017年1月10日

JELLYFISH - Fast, Parallel k-mer Counting for DNA

摘要： kmer分析其实是非常耗费计算资源的，如果我们自己写脚本来分析kmer的话，首先要将所有的序列打断成一定长度的kmer，然后将所有的kmer存储起来，最后统计每个kmer出现的频率，或者统计出现指定次数的kmer一共有多少个。为了节省资源，我们可以使用 Jellyfish 这个现成的软件来分析。 JELLYFISH - Fast, Parallel k-mer Counting for DN... 阅读全文

posted @ 2017-01-10 17:20 Life·Intelligence 阅读(877) 评论(0) 推荐(0)

外泌体

摘要：外泌体现在很火，搞医学的都应该好好了解它。外泌体简介 1983年，外泌体首次于绵羊网织红细胞中被发现， 1987年Johnstone将其命名为“exosome”。现今，其特指直径在40-100nm的盘状囊泡。多种细胞在正常及病理状态下均可分泌外泌体。其主要来源于细胞内内溶酶体微粒内陷形成的多囊泡体，经多囊泡体外膜与细胞膜融合后释放到胞外基质中。外泌体介导的细胞间通讯人体内多种细胞及... 阅读全文

posted @ 2017-01-10 14:33 Life·Intelligence 阅读(1981) 评论(0) 推荐(0)

CDS & ORF & 启动子 & 终止子 & 转录因子 & 基因结构 & UTR

摘要： ORF和CDS的区别 ORF的英文展开是open reading frame（开放阅读框）。 CDS的英文展开是coding sequences （编码区）。 CDS：DNA转录成mRNA,mRNA经剪接等加工后翻译出蛋白质,所谓CDS就是与蛋白质序列一一对应的DNA序列,且该序列中间不含其它非该阅读全文

posted @ 2017-01-10 11:43 Life·Intelligence 阅读(13002) 评论(0) 推荐(0)

SSR分子标记

摘要：参考： SSR标记分子标记开发与筛选之SSR SSR 分子标记开发策略及评价 SSR分子标记在牡丹亲缘关系研究中的应用与研究进展 SSR(Simple Sequence Repeats)标记是近年来发展起来的一种以特异引物PCR为基础的分子标记技术，也称为微卫星DNA(MicrosatelliteDNA),是一类由几个核苷酸（一般为1~6个）为重复单位组成的长达几十个核苷酸的串联... 阅读全文

posted @ 2017-01-10 09:48 Life·Intelligence 阅读(1191) 评论(0) 推荐(0)

2017年1月9日

Entrez检索实例 - NCBI

摘要：题目：已知来豆荚斑驳病毒（bean pod mottle virus，BPMV）的名字，查询BPMV基因组信息、核酸序列信息、蛋白序列信息和结构信息解答： 1.直接搜索，点genome，即可看到病毒基因组信息 2.点击Nucleotide，即可查看相关核酸信息 3.点击Protein即可查看BPMV转录相关蛋白信息 4.结构数据库查询，点击Structure即可，可... 阅读全文

posted @ 2017-01-09 23:46 Life·Intelligence 阅读(1625) 评论(0) 推荐(0)

分子进化与系统发育

摘要：参考：吴祖建, 高芳銮, 沈建国. 生物信息学分析实践[M]. 科学出版社, 2010. 薛大牛说过，搞生物信息的不能挑食，有啥就该做啥。生物信息中的一大热点就是进化分析，推断出一个物种在整个群体中的进化过程。先读一篇科普文章：（源宜基因）生物的进化指的是生物群体性质随时间经历的变化。分子生物学的发展大大加快了进化研究的前进步伐，DNA序列，凭借自身相对稳定的进化演变过程和巨大的信息... 阅读全文

posted @ 2017-01-09 17:25 Life·Intelligence 阅读(2566) 评论(0) 推荐(0)

Isotig & cDNA & gene structure & alternative splicing & gene loci & 表达谱

摘要：参考：高通量测序相关名词 Isotig 指在转录组de novo测序时，用454平台测序完成后组装出的结果，一个isotig可视为一个转录本。 Isogroup 指转录组de novo测序中，用454平台测序完成后组装出的结果获得的可聚类到同一个基因的转录本群。 alternative splicing：可变剪切 gene loci：基因座（wiki），转录表达谱：又叫基因表... 阅读全文

posted @ 2017-01-09 16:19 Life·Intelligence 阅读(721) 评论(0) 推荐(0)

（转）如何成为顶级生物信息学家？

摘要：每过一段时间就要读一遍，看看自己现在到底在哪个等级了。前几天去南京参加两年一度的全国大会CCBSB2014，今年是第六届，见到许多熟识的前辈和老朋友，也结识了不少新朋友。相比于两年前在哈尔滨开的第五届大会，参会人数又多了100多。连大会特邀报告算上，总共76位学者做口头报告，其中30位学者我之前并阅读全文

posted @ 2017-01-09 15:49 Life·Intelligence 阅读(4731) 评论(0) 推荐(0)

unique mapped reads

摘要：就是指唯一比对的reads 现在人们已经开始避免使用unique mapped reads这个概念了，而转向使用mapq值来保留高质量的比对结果。因为mapq值反应了一组比对结果发生的可能性，MapQ = -10 log10(P), 比如结果为10，那就是1/10的概率会出现这个比对结果，如果我们认为0.05%是一个小概率的话，那个mapq值为15就可以用于筛选了, 如果认为0.01%是个小概率... 阅读全文

posted @ 2017-01-09 15:03 Life·Intelligence 阅读(3830) 评论(0) 推荐(0)

测序中Q20 Q30 Q40

摘要：你能给别人讲清楚这个概念吗？二代测序中，每测一个碱基会给出一个相应的质量值，这个质量值是衡量测序准确度的。碱基的质量值13，错误率为5%，20的错误率为1%，30的错误率为0.1%。行业中Q20与Q30则表示质量值≧20或30的碱基所占百分比。例如一共测了1G的数据量，其中有0.9G的碱基质量值大于或等于20，那么Q20则为90%。 Q20值是指的测序过程碱基识别（Base... 阅读全文

posted @ 2017-01-09 14:40 Life·Intelligence 阅读(37179) 评论(0) 推荐(2)

基因组的外显子探究

摘要：这是我们论坛上的一个题目：生信编程直播第一题：人类基因组的外显子区域到底有多... 外显子组的序列仅占全基因组序列的1%左右，但大多数与疾病相关的变异位于外显子区。通过外显子组测序可鉴定约8万个变异，全基因组测序可鉴定300万个变异，因此与全基因组测序相比，外显子组测序不仅费用较低，数据阐释也更为简单。外显子组测序技术以其经济有效的优势广泛应用于孟德尔遗传病、罕见综合征及复杂疾病的研... 阅读全文

posted @ 2017-01-09 11:19 Life·Intelligence 阅读(3284) 评论(0) 推荐(0)

consensus sequence

摘要： consensus sequence：称为一致序列。一些遗传元件(如启动子)中反复出现且很少有改变的DNA序列。不同种生物编码同一种蛋白质的基因也会有共有序列。通过序列比较发现相似但不一定完全相同的核苷酸序列或氨基酸序列。 consensus 的意思很多，接下来还会总结。阅读全文

posted @ 2017-01-09 10:33 Life·Intelligence 阅读(1566) 评论(0) 推荐(0)

2017年1月8日

几种同源关系：直系同源、旁系同源和异同源

摘要：搞生物信息的必须搞清楚这几种同源关系！参考：直系同源和旁系同源直系同源(orthologous) 指的是不同物种之间的同源性，例如蛋白质的同源性，DNA序列的同源性。Orthologs是指来自于不同物种的由垂直家系（物种形成）进化而来的蛋白，并且典型的保留与原始蛋白有相同的功能。旁系同源（Pa 阅读全文

posted @ 2017-01-08 21:07 Life·Intelligence 阅读(6891) 评论(0) 推荐(0)

2017年1月4日

PacBio三代全长转录组/Iso-Seq技术及案例分析

摘要：读透一篇文章比粗读100篇文章都要有用！！！参考：产品手册 PacBio三代全长转录组有什么优势？近年来，随着高通量测序技术的发展，转录组测序已经成为研究基因表达调控的主要手段。但二代的转录本重构准确率很低，三代可以直接得到全长转录本，无需组装。可改善基因表达定量结果，发现新的基因和转录异构体，鉴定可变剪切及基因融合现象。 Google第一个就是官网介绍，可以立马理解Iso-Seq的字... 阅读全文

posted @ 2017-01-04 14:46 Life·Intelligence 阅读(9417) 评论(0) 推荐(1)

Digital-LI