摘要:
生物信息的工具和数据库太多,但有一些基础的工具是必须精通的,甚至需要经常翻阅寻找灵感。 通用数据库: UCSC Genome Browser - 基因组的可视化 OMIM - Online Mendelian Inheritance in Man - 研究疾病必备 专业数据库汇总: 单细胞数据库汇总 阅读全文
摘要:
The Lady Tasting Tea - How Statistics Revolutionized Science in the Twentieth Century 本书只讨论了20世纪这100年间的统计大变革。 一般的书读读就行,唯独这本书需要慢慢品读,让统计的思想深入骨髓。 这本书不适合空 阅读全文
摘要:
网页开发,尤其是交互式动态网页的开发,是有一定门槛的,如果你有一定的R基础,又不想过深的接触PHP和MySQL,那R的shiny就是一个不错的选择。 现在R shiny配合R在统计分析上的优势,可以做出非常优秀的科学网站,但我见过的shiny还是多用于本地网站搭建,因为不是每个实验室都能拿出大量的财 阅读全文
摘要:
华大科技服务开发一套优秀的交互式结题报告系统,适用于没有代码基础的老师分析自己的数据。 http://report.bgi.com/ps/login/login.html 体验之后再做评价! 见云盘:https://pan.genomics.cn/ucdisk/s/RF3Aji 阅读全文
摘要:
需要长期更新! 参考:生信修炼手册 enhancer的基本概念: 长度几十到几千bp,作用是提高靶基因活性,属于顺式作用原件,DNA作用到DNA,转录因子就是反式,是结合到DNA的蛋白。 1981年,Benerji发现SV40中某个140bp的序列可以显著提高血红蛋白融合基因的表达水平。 特性:远距 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文
摘要:
这个时代已经是多学科相互渗透的时代,纯粹的传统学科在没落,新兴的交叉学科在不断兴起。 life science neurosciences statistics computer science information theory 我的问题很简单: 想回答这些问题就必须要学习信息论! 什么是信息? 阅读全文
摘要:
单细胞技术在飞速发展,随着数据的积累,对应的数据库也相应出现。 CellMarker - 总结了目前的celltype对应的marker,同时给出了数据的文献链接。 Mouse Cell Atlas - 2017年Nature文章,相当于把整个小鼠都测了,得到了一大堆的10x数据,郭国冀。 Pang 阅读全文
摘要:
2022年09月06日 新方法:R | 提取GO分类下的所有基因 library(tidyverse) # library(org.Hs.eg.db) library(org.Mm.eg.db) GOID <- c("GO:0042573") # GOgeneID <- get(GOID, org. 阅读全文
摘要:
什么是定理,什么是公理? 定理:已证实。对于全部情形都得到了证明。公理:未证伪。无法穷举全部情形,但尚未发现反例。 大数定律 | law of large numbers 随着试验数量的增大,样本中随机变量的均值会无限趋近与理论上的期望。 大数定律是现代统计的基石。 应用:抽样中用样本估计总体的理论 阅读全文
摘要:
Genome Aggregation Database (gnomAD) 这是一个关于什么的数据库?broad institute开发的,整合了目前几乎所有的公共的WES和WGS测序数据,并对数据做了一些总结,可供其他开发者使用。 怎么使用gnomAD? 查感兴趣的基因 查感兴趣的variant 参 阅读全文
摘要:
Laplacian和PCA貌似是同一种性质的方法,坐标系变换。只是拉普拉斯属于图论的范畴,术语更加专业了。 要看就把一篇文章看完整,再看其中有什么值得借鉴的,总结归纳理解后的东西才是属于你的。 问题: 1. 这篇文章有哪些亮点决定他能发NM?单细胞,consensus,较好的表现,包装了一些专业的术 阅读全文
摘要:
Common sense reduced to computation - Pierre-Simon, marquis de Laplace (1749–1827) Inventor of Bayesian inference 贝叶斯方法的逻辑十分接近人脑的思维;人脑的优势不是计算,在纯数值计算方面 阅读全文
摘要:
学贝叶斯方法时绕不过去的一个问题,现在系统地总结一下。 之前过于纠结字眼,似然和概率到底有什么区别?以及这一个奇妙的对等关系(其实连续才是f,离散就是p)。 似然函数 | 似然值 wiki:在数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。 这里我们讨论的范围已经界定 阅读全文
摘要:
搞科研,尤其是生命科学,经常会觉得自己做的东西是坨屎,没有任何意义。 在硕博的时候这种感觉会非常强烈,一个是自己思考能力不足;二是你的项目不是你设计的,不懂个中缘由,只执行的话就会很无聊,找不到意义感。 为什么我们的研究问题必须有意义? 实际上所有的研究问题都是有意义的,单调地重复别人的研究、在混乱 阅读全文
摘要:
先开题,慢慢补充。 参考: 什么是响应面(RSM)分析 Response-Surface Methods in R, Using rsm In-class Examples with R Code Response Surface Analysis (RSM) Lesson 11: Response 阅读全文
摘要:
吲哚是啥?在茶叶成分中的地位?乌龙茶?香气,重要的前体,比如色氨酸Trp、IAA。 Indole is a characteristic volatile constituent in oolong tea. Our previous study indicated that indole was 阅读全文
摘要:
前言 做RNA-seq基因表达数据分析挖掘,我们感兴趣的其实是“基因互作”,哪些基因影响了我们这个基因G,我们的基因G又会去影响哪些基因,从而得到基因调控的机制。 直觉确实是很明确的,但是细节处却有很多问题。 我们讨论的到底是基因表达的互作,还是基因产物的互作? 对于蛋白编码基因,它翻译产生蛋白,如 阅读全文
摘要:
主要会用到两个R包: rentrez: 'Entrez' in Rscholar: Analyse Citation Data from Google Scholar RISmed 包可以查询 PubMed 数据库中的信息。 目的1:输入检索词,从GSE数据库中爬取附带的参考文献。 R schola 阅读全文