上一页 1 ··· 26 27 28 29 30 31 32 33 34 ··· 38 下一页
摘要: 每过一段时间就要读一遍,看看自己现在到底在哪个等级了。 前几天去南京参加两年一度的全国大会CCBSB2014,今年是第六届,见到许多熟识的前辈和老朋友,也结识了不少新朋友。相比于两年前在哈尔滨开的第五届大会,参会人数又多了100多。连大会特邀报告算上,总共76位学者做口头报告,其中30位学者我之前并 阅读全文
posted @ 2017-01-09 15:49 Life·Intelligence 阅读(4593) 评论(0) 推荐(0) 编辑
摘要: 就是指唯一比对的reads 现在人们已经开始避免使用unique mapped reads这个概念了,而转向使用mapq值来保留高质量的比对结果。因为mapq值反应了一组比对结果发生的可能性,MapQ = -10 log10(P), 比如结果为10,那就是1/10的概率会出现这个比对结果,如果我们认为0.05%是一个小概率的话,那个mapq值为15就可以用于筛选了, 如果认为0.01%是个小概率... 阅读全文
posted @ 2017-01-09 15:03 Life·Intelligence 阅读(3689) 评论(0) 推荐(0) 编辑
摘要: 你能给别人讲清楚这个概念吗? 二代测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。碱基的质量值13,错误率为5%,20的错误率为1%,30的错误率为0.1%。行业中Q20与Q30则表示质量值≧20或30的碱基所占百分比。例如一共测了1G的数据量,其中有0.9G的碱基质量值大于或等于20,那么Q20则为90%。 Q20值是指的测序过程碱基识别(Base... 阅读全文
posted @ 2017-01-09 14:40 Life·Intelligence 阅读(34700) 评论(0) 推荐(2) 编辑
摘要: 这是我们论坛上的一个题目:生信编程直播第一题:人类基因组的外显子区域到底有多... 外显子组的序列仅占全基因组序列的1%左右,但大多数与疾病相关的变异位于外显子区。通过外显子组测序可鉴定约8万个变异,全基因组测序可鉴定300万个变异,因此与全基因组测序相比,外显子组测序不仅费用较低,数据阐释也更为简单。外显子组测序技术以其经济有效的优势广泛应用于孟德尔遗传病、罕见综合征及复杂疾病的研... 阅读全文
posted @ 2017-01-09 11:19 Life·Intelligence 阅读(3166) 评论(0) 推荐(0) 编辑
摘要: consensus sequence:称为一致序列。一些遗传元件(如启动子)中反复出现且很少有改变的DNA序列。不同种生物编码同一种蛋白质的基因也会有共有序列。通过序列比较发现相似但不一定完全相同的核苷酸序列或氨基酸序列。 consensus 的意思很多,接下来还会总结。 阅读全文
posted @ 2017-01-09 10:33 Life·Intelligence 阅读(1461) 评论(0) 推荐(0) 编辑
摘要: 搞生物信息的必须搞清楚这几种同源关系! 参考:直系同源和旁系同源 直系同源(orthologous) 指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。Orthologs是指来自于不同物种的由垂直家系(物种形成)进化而来的蛋白,并且典型的保留与原始蛋白有相同的功能。 旁系同源(Pa 阅读全文
posted @ 2017-01-08 21:07 Life·Intelligence 阅读(6291) 评论(0) 推荐(0) 编辑
摘要: 读透一篇文章比粗读100篇文章都要有用!!! 参考:产品手册 PacBio三代全长转录组有什么优势? 近年来,随着高通量测序技术的发展,转录组测序已经成为研究基因表达调控的主要手段。但二代的转录本重构准确率很低,三代可以直接得到全长转录本,无需组装。可改善基因表达定量结果,发现新的基因和转录异构体,鉴定可变剪切及基因融合现象。 Google第一个就是官网介绍,可以立马理解Iso-Seq的字... 阅读全文
posted @ 2017-01-04 14:46 Life·Intelligence 阅读(9180) 评论(0) 推荐(1) 编辑
摘要: 参考资料: 【cfDNA专题】cell-free DNA在非肿瘤疾病中的临床价值(好) ctDNA, cfDNA和CTCs有什么区别吗? cfDNA你懂多少? 新发现 | 基因是否表达,做个cfDNA全基因组测序就可揭晓 游离DNA Cell-Free DNA (cfDNA) Isolation 游离DNA (circulating cell free DNA,cfDNA),是... 阅读全文
posted @ 2017-01-04 14:19 Life·Intelligence 阅读(3385) 评论(0) 推荐(0) 编辑
摘要: 参考: 独占鳌头的Illumina仪器(二代测序篇) HiSeq2000测序原理、流程与仪器 NGS文库制备的方法比较[心得点评] 各种测序文库构建方式 样本:就是待测的DNA、RNA或蛋白序列,样本来源单一的就是单样本,样本来源于多处就是多样本,一般我们测序用的样本都是单样本,但有时候有特殊需求,我们会把一些样本混合在一起测序,也就是多样本测序。 文库:二代三代读长都是有限的,... 阅读全文
posted @ 2017-01-04 11:13 Life·Intelligence 阅读(17067) 评论(0) 推荐(0) 编辑
摘要: 参考: 转录组文章的常规套路 文章解读:《Science》小麦转录组研究文章 转录组数据饱和度评估方法 Paper这个东西是多么的诱人,可以毕业,可以评职称,可以拿绩效。 现在的文章都是有套路的,也不能说是水文,但大多是一个模式下的产物,真正有价值的好文其实是少之又少的。 大部分的Paper都是八股文,只需要填词就好了。 Transcriptome analysis of ... 阅读全文
posted @ 2017-01-03 17:03 Life·Intelligence 阅读(2144) 评论(0) 推荐(0) 编辑
摘要: 课程主页:https://www.coursera.org/learn/machine-learning/home/welcome 收集再多的资料也没用,关键是要自己理解总结,做笔记就是一个归纳总结的过程,把自己理解的核心逻辑记录下来,供以后回顾。 千万不要把一些自己没理解归纳的材料摘抄下来当做笔记 阅读全文
posted @ 2016-12-30 01:25 Life·Intelligence 阅读(851) 评论(0) 推荐(2) 编辑
摘要: 分类 第一章 机器学习基础 第二章 k-近邻算法 第三章 决策树 第四章 基于概率论的分类方法:朴素贝叶斯 第五章 Logistics回归 第六章 支持向量机 第七章 利用AdaBoost元算法提高分类性能 回归 第八章 预测数值型数据:回归 第九章 树回归 无监督学习 第十章 利用K-均值聚类算法对未标注数据分组 第十一章 使用Apriori算法进行关联分析 第十二章... 阅读全文
posted @ 2016-12-29 21:22 Life·Intelligence 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 参考: Lander-Waterman Model 这个模型是鸟枪法测序和基因组装的最基本的理论模型,它揭示了测序深度与覆盖度之间的关系。 该模型回答了一个最基本的问题:How many reads to we need to be sure we cover the whole genome? Genome Sequencing - PPT Chapter 5.1. Lander... 阅读全文
posted @ 2016-12-29 14:18 Life·Intelligence 阅读(1631) 评论(0) 推荐(0) 编辑
摘要: 参考: 五大常用算法之三:贪心算法 算法系列:贪心算法 贪心算法详解 从零开始学贪心算法 一、基本概念: 所谓贪心算法是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的仅是在某种意义上的局部最优解。 贪心算法没有固定的算法框架,算法设计的关键是贪心策略的选择。必须注意的是,贪心算法不是对所有问题都能得到整体最优解,选择的贪心策略必... 阅读全文
posted @ 2016-12-29 13:44 Life·Intelligence 阅读(2150) 评论(0) 推荐(0) 编辑
摘要: 参考: BWT (Burrows–Wheeler_transform)数据转换算法 压缩技术主要的工作方式就是找到重复的模式,进行紧密的编码。 BWT(Burrows–Wheeler_transform)将原来的文本转换为一个相似的文本,转换后使得相同的字符位置连续或者相邻,之后可以使用其他技术如:Move-to-front transform 和 游程编码 进行文本压缩。 1 BW... 阅读全文
posted @ 2016-12-29 11:20 Life·Intelligence 阅读(2819) 评论(0) 推荐(0) 编辑
摘要: 参考: 从前缀树谈到后缀树 后缀树 Suffix Tree—后缀树 字典树(trie树)、后缀树 一.前缀树 简述:又名单词查找树,tries树,一种多路树形结构,常用来操作字符串(但不限于字符串),和hash效率有一拼(二者效率高低是相对的,后面比较)。 性质:不同字符串的相同前缀只保存一份。 操作:查找,插入,删除。 举个例子: 假设有这么几个单词 ... 阅读全文
posted @ 2016-12-29 10:57 Life·Intelligence 阅读(632) 评论(0) 推荐(1) 编辑
摘要: 参考: Hash table - Wiki Hash table_百度百科 从头到尾彻底解析Hash表算法 谈谈 Hash Table 我们身边的哈希,最常见的就是perl和python里面的字典了,字典有什么性质,给定键就可以直接找到值,字典封装了一种映射关系(散列函数),它和数组完全不同,数组是根据地址来访问值。 定义:给定表M,存在函数f(key),对任意给定... 阅读全文
posted @ 2016-12-29 10:42 Life·Intelligence 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 参考: Suffix array - Wiki 后缀数组(suffix array)详解 6.3 Suffix Arrays - 算法红宝书 Suffix Array 后缀数组 基本概念 应用:字符串处理、生物信息序列处理 后缀:学过英语的都知道什么叫后缀,就是从某个位置开始到字符串结尾的特殊子串,记住 Suffix(i)=S[i...len(S)-1],... 阅读全文
posted @ 2016-12-29 10:17 Life·Intelligence 阅读(1024) 评论(0) 推荐(0) 编辑
摘要: Michael Schatz - Cold Spring Harbor Laboratory 最近在研究 BWA mem 序列比对算法,直接去看论文,看不懂,论文就3页,太精简了,好多背景知识都不了解。 通过Google,发现了一系列序列比对的课程,讲得真是太好了,真是捡到宝了!!! 如果你想搞透生物信息的基石 - 序列比对算法,那你一定得看完这些教程。 国内的课程、教材和文章都是抄来抄去... 阅读全文
posted @ 2016-12-28 17:42 Life·Intelligence 阅读(560) 评论(0) 推荐(0) 编辑
摘要: 用“machine learning genomics”在 biorxiv 中检索(限定一下Bioinformatics领域),查看最新文章的标题和摘要,看看机器学习都能做些什么实际的项目。 1.Machine-learning annotation of human splicing branchpoints(RNA剪切体位点预测) 使用机器学习来注释人类剪切体的分支点 需要有 RNA s... 阅读全文
posted @ 2016-12-28 14:22 Life·Intelligence 阅读(4627) 评论(0) 推荐(1) 编辑
上一页 1 ··· 26 27 28 29 30 31 32 33 34 ··· 38 下一页
TOP