摘要:
、 1、What is a Chi Square Test? 卡方检验有两种类型。两者使用卡方统计量和分布的目的不同。 第一种:卡方拟合优度检验确定样本数据是否与总体匹配。(这里不介绍) 第二种:独立性的卡方检验比较列联表中的两个变量,看看它们是否相关。在更一般的意义上,它测试分类变量的分布是否不同
阅读全文
posted @ 2019-01-01 15:57
发那个太丢人
阅读(1751)
推荐(0)
编辑
摘要:
1、 What is a Z-Score? 简单地说,z分数就是数据距离均值有多少个标准差。但更严格地说,它衡量的是一个数值偏离总体均值以上或以下多少个标准差。z分数也称为标准分数,可以放在正态分布曲线上。z分数范围从-3个标准差(落在正态分布曲线的最左边)到+3个标准差(落在正态分布曲线的最右边)
阅读全文
posted @ 2019-01-01 15:03
发那个太丢人
阅读(2114)
推荐(0)
编辑
摘要:
1、What is the T Distribution? T分布(也叫Student 's T分布)是一组与正态分布曲线几乎相同的分布,只是更短更胖一点。当有小样本时,使用t分布而不是正态分布。样本容量越大,t分布越接近正态分布。事实上,对于大于20的样本容量(如自由度),其分布与正态分布几乎完全
阅读全文
posted @ 2019-01-01 13:36
发那个太丢人
阅读(5495)
推荐(0)
编辑
摘要:
1、what is the Definition of a Confidence Interval? 置信区间是特定统计量的不确定性。置信区间通常有误差范围。它告诉你,你有多大的信心,从民意调查或调查的结果,反映出你会发现什么,如果有可能调查整个群体。置信区间与置信水平(confidence lev
阅读全文
posted @ 2019-01-01 11:14
发那个太丢人
阅读(933)
推荐(1)
编辑
摘要:
1、Alpha Level (Significance Level,显著水平): What is it? 在了解之前首先看一下什么是一类错误和二类错误 2. Alpha Levels / Significance Levels: Type I and Type II errors 在假设检验中,有两
阅读全文
posted @ 2018-12-31 22:06
发那个太丢人
阅读(3255)
推荐(0)
编辑
摘要:
1、Null Hypothesis Overview 零假设,H0是普遍接受的事实;这与备择假设(alternate hypothesis)正好相反。研究人员努力否定、驳斥零假设。研究人员提出了另一种假设(alternate hypothesis),他们认为这种假设可以解释一种现象,然后努力拒绝零假
阅读全文
posted @ 2018-12-31 14:51
发那个太丢人
阅读(2219)
推荐(0)
编辑
摘要:
1、什么是p-value p值用于假设检验,以帮助您支持或拒绝零假设。p值是反对零假设的证据。p值越小,拒绝原假设的证据就越强p A p value is used in hypothesis testing to help you support or reject the null hypoth
阅读全文
posted @ 2018-12-31 14:28
发那个太丢人
阅读(805)
推荐(0)
编辑
摘要:
1、什么是T test? t-test:比较数据的均值,告诉你这两者之间是否相同,并给出这种不同的显著性(即是否是因为偶然导致的不同) 例子:制药公司可能想测试一种新的抗癌药物,看看它是否能提高预期寿命。在实验中,总有一个对照组(给一组人服用安慰剂,或“糖丸”)。对照组的平均预期寿命为+5岁,而服用
阅读全文
posted @ 2018-12-31 10:35
发那个太丢人
阅读(9481)
推荐(0)
编辑
摘要:
1、基本统计 summary函数:R中的summary函数根据输入的类提供输入的摘要。该函数根据输入对象的类调用各种函数。返回值也取决于输入对象。例如,如果输入是一个由数字数据组成的向量,它将为数据提供平均值、中值、最小值、最大值和四分位数,而如果输入是表格(数字)数据,它将为每一列提供类似的计算。
阅读全文
posted @ 2018-12-30 20:23
发那个太丢人
阅读(898)
推荐(0)
编辑
摘要:
1、我的电脑 高级系统设置 2、选中环境变量,保存。 3、在系统环境变量PATH中,加入Anaconda3及Script路径加入其中 4、测试python
阅读全文
posted @ 2018-12-30 12:22
发那个太丢人
阅读(8613)
推荐(0)
编辑
摘要:
1、R和Rstudio下载地址 https://cran.rstudio.com/a 2、Rstudio 的配置 外观、代码显示比例配置 选中tools 选中globle options 选中appearance 选择主题、缩放比例、字体、字体大小 华丽丽的分割线 3、R简介 执行特定功能最基本的是
阅读全文
posted @ 2018-12-30 11:03
发那个太丢人
阅读(1332)
推荐(0)
编辑
摘要:
摘要:Wright’s F‑statistics, and especially FST, provide important insights into the evolutionary processes that influence the structure of genetic varia
阅读全文
posted @ 2018-12-27 20:22
发那个太丢人
阅读(503)
推荐(0)
编辑
posted @ 2018-12-24 17:14
发那个太丢人
阅读(186)
推荐(0)
编辑
摘要:
1、问题描述 经常在删除文件的时候有一些文件提示需要管理员权限 2、解决 选中文件-右键-安全-编辑-完全控制✔即可
阅读全文
posted @ 2018-12-05 22:33
发那个太丢人
阅读(202)
推荐(0)
编辑
摘要:
1)下载https://www.anaconda.com/download/ 2)安装 3)终端查看(Anaconda Prompt) 4)升级所有的包 初次安装下的软件包版本一般都比较老旧,因此提前更新可以避免未来不必要的问题。 conda upgrade --all 5)安装、卸载、更新包 co
阅读全文
posted @ 2018-12-05 19:36
发那个太丢人
阅读(599)
推荐(0)
编辑
摘要:
一、电脑设置免登录密码及修改密码 1、win+R 2、输入control userpasswords2 3、勾选免密码账号登陆,修改密码 二、打开性能监视器 1、win+R 2、输入perfmon.exe 三、查看电脑名 1) win+R 2)输入cmd 3)写入 net user 四、经常清除临时
阅读全文
posted @ 2018-12-05 17:03
发那个太丢人
阅读(280)
推荐(0)
编辑
摘要:
https://cosx.org/2013/01/lda-math-gamma-function
阅读全文
posted @ 2018-11-05 22:30
发那个太丢人
阅读(204)
推荐(0)
编辑
摘要:
https://blog.csdn.net/bitcarmanlee/article/details/82156281?utm_source=blogxgwz1
阅读全文
posted @ 2018-11-05 22:13
发那个太丢人
阅读(125)
推荐(0)
编辑
摘要:
1、导读 分子进化的重要原理如基因进化的重复进化(gene duplication)、分子钟等(moleculer clock)都是通过研究氨基酸序列发现的。 这里之所以先介绍氨基酸进化的原因: 1)比DNA序列更加保守 2)蛋白质编码基因的DNA序列的对位排列分析上,需要氨基酸序列矫正 3)氨基酸
阅读全文
posted @ 2018-11-01 21:43
发那个太丢人
阅读(2758)
推荐(0)
编辑
摘要:
0、History The distribution was first introduced by Siméon Denis Poisson (1781–1840) and published, together with his probability theory, in 1837 in hi
阅读全文
posted @ 2018-10-28 22:04
发那个太丢人
阅读(1167)
推荐(0)
编辑
摘要:
1)“win+R”打开运行,输入“control”后回车,打开控制面板 2)选NAVADI控制面板打开 3)在打开的【NVIDIA控制面板】菜单栏,单击【桌面】,然后将弹出菜单前面的打的勾全部去掉
阅读全文
posted @ 2018-10-27 19:07
发那个太丢人
阅读(2523)
推荐(0)
编辑
摘要:
1、打开设置 2、选择系统 3、 选择存储 4、打开存储感知,点击立即释放空间进行垃圾收索 5、文件删除
阅读全文
posted @ 2018-10-27 11:46
发那个太丢人
阅读(128)
推荐(0)
编辑
摘要:
如果我们想要加快win10系统运行速度的话,就需要定期整理碎片才可以,减少卡顿,提高性能。 一:注意事项 固态硬盘用户千万不要使用‘磁盘碎片整理功能’,因为使用的技术不一样,使用window自带的该功能会使固态硬盘的寿命大大减少 二:查看磁盘类型及优化 1、按WIN+R打开“运行”对话框,输入dfr
阅读全文
posted @ 2018-10-27 10:26
发那个太丢人
阅读(501)
推荐(0)
编辑
摘要:
当电脑及其卡顿的时候,想打开任务管理器关掉所有运行的程序的时候,也会变得及其困难。因此之前你如果有犀利的小程序设置,这都不会是问题。 1)空白处右键-新建-快捷方式 2)将下列代码复制到下列框中(注意要修改***为自己的电脑用户名) taskkill /F /FI "USERNAME eq ***"
阅读全文
posted @ 2018-10-26 20:47
发那个太丢人
阅读(1196)
推荐(0)
编辑
摘要:
一)win10系统后台应用有两大特点: 1、win10系统有许多系统自带应用软件,在系统任务栏中看不到任何自带的应用程序运行 2、但通过任务管理器的进程中,可直观的看到许多非系统进程正在运行。 二)后台程序的影响: 既然是后台应用,也就是说,它仍然在运行。既然在运行,它就要占用系统资源。有时候,当你
阅读全文
posted @ 2018-10-26 20:19
发那个太丢人
阅读(3745)
推荐(0)
编辑
摘要:
1.1 生命之树 1、生物学家的梦想 一句话:构建生命之树。 2、方法与途径 最理想的途径是通过化石证据,然而化石之零散和不完整,因此大多数研究者转为比较形态学和比较生理学。通过这两个途径,基本可以得出有机体进化历史的主题框架。但是,形态及生理性状进化之复杂,不可能产生一副清晰的图像。 相比比较形态
阅读全文
posted @ 2018-10-25 22:15
发那个太丢人
阅读(621)
推荐(0)
编辑
posted @ 2018-09-30 11:42
发那个太丢人
阅读(373)
推荐(0)
编辑
摘要:
1)介绍 来自NCBI的Gene Expression Omnibus(GEO)作为各种高通量实验数据的公共存储库。 这些数据包括基于单通道和双通道微阵列的实验,测量mRNA,基因组DNA和蛋白质丰度;以及非阵列技术,如基因表达系列分析(SAGE)和质谱蛋白质组学数据。 在GEO最基本的组织级别中,
阅读全文
posted @ 2018-09-27 14:59
发那个太丢人
阅读(944)
推荐(0)
编辑
摘要:
1) Introduction 为了理解基因组数据,通常旨在在基因组浏览器中绘制这样的数据,以及各种基因组注释特征,例如基因或转录物模型,CpG岛,重复区域等。这些功能可以从ENSEMBL或UCSC等公共数据库中提取,也可以在内部生成或策划。许多当前可用的基因组浏览器在显示基因组注释数据方面做了合理
阅读全文
posted @ 2018-09-27 11:17
发那个太丢人
阅读(1749)
推荐(0)
编辑
摘要:
1)介绍 我们用SRAdb library来对SRA数据进行处理。 SRAdb 可以更方便更快的接入 metadata associated with submission, 包括study, sample, experiment, and run. SRAdb 包通过 NCBI SRA数据库中的m
阅读全文
posted @ 2018-09-21 17:05
发那个太丢人
阅读(3277)
推荐(0)
编辑
摘要:
1) 熟悉CEL file 从 NCBI GEO (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE24460)下载GSE24460. 将得到一个 GSE24460_RAW.tar 文件,解压。产生CEL文件,包含各种信息。 如果不是从CEL
阅读全文
posted @ 2018-09-20 15:49
发那个太丢人
阅读(1172)
推荐(0)
编辑
摘要:
1)介绍 在分析序列时,我们通常对特定的连续子序列感兴趣。 例如,a矢量可以被认为是按字母顺序排列的小写字母序列。 我们将第一个五个字母(a到e)称为连续的子序列,而仅包含元音的子序列不会是连续的。 分析任务仅关注区域的几何形状,而忽略基础序列值的情况并不少见。 索引列表是选择子序列的简单方法。 然
阅读全文
posted @ 2018-09-20 10:14
发那个太丢人
阅读(277)
推荐(0)
编辑
摘要:
1)airway简介 在该workflow中,所用的数据集来自RNA-seq,气道平滑肌细胞(airway smooth muscle cells )用氟美松(糖皮质激素,抗炎药)处理。例如,哮喘患者使用糖皮质激素来减少呼吸道炎症,在该实验设计中,4种细胞类型(airway smooth muscl
阅读全文
posted @ 2018-09-19 10:12
发那个太丢人
阅读(2269)
推荐(0)
编辑
摘要:
基本概念 Biostrings包很重要的3个功能是进行Pairwise sequence alignment 和Multiple sequence alignment及 Pattern finding in a sequence 序列比对一般有2个过程: 1)构建计分矩阵公式(the scoring
阅读全文
posted @ 2018-09-18 11:05
发那个太丢人
阅读(2221)
推荐(0)
编辑
摘要:
缺点:需要联网,经常出错,不是操作问题而是因为网络问题 安装 ###Retrieving a sequence and write into FASTA file### 1) 选择要去fetch序列的数据库(这里已genebank为例) 2)一旦选择好了数据库,用query信息进行收索 3)查看qu
阅读全文
posted @ 2018-09-17 12:01
发那个太丢人
阅读(1411)
推荐(0)
编辑
摘要:
1)简介 edgeR作用对象是count文件,rows 代表基因,行代表文库,count代表的是比对到每个基因的reads数目。它主要关注的是差异表达分析,而不是定量基因表达水平。 edgeR works on a table of integer read counts, with rows co
阅读全文
posted @ 2018-09-14 15:43
发那个太丢人
阅读(4377)
推荐(0)
编辑
摘要:
1)简介: DESeq2-package: for differential analysis of count data(对count data 做差异分析) 2)安装 if("DESeq2" %in% rownames(installed.packages()) == FALSE) {sourc
阅读全文
posted @ 2018-09-13 17:12
发那个太丢人
阅读(1798)
推荐(0)
编辑
摘要:
1)enrichGO:(GO富集分析) 描述:GO Enrichment Analysis of a gene set. Given a vector of genes, this function will return the enrichment GO categories after FDR
阅读全文
posted @ 2018-09-13 10:08
发那个太丢人
阅读(784)
推荐(0)
编辑
摘要:
转自:http://www.biotrainee.com/thread-411-1-1.html 常用数据库 ID Ensembl stable IDs Ensembl stable ID 的结构是根据不同物种设置的前缀, 加上数据所指的类型, 如基因蛋白质, 再加上一系列的数字. 有的时候可以有不
阅读全文
posted @ 2018-09-12 19:49
发那个太丢人
阅读(1252)
推荐(0)
编辑
posted @ 2018-09-12 18:04
发那个太丢人
阅读(621)
推荐(1)
编辑