Fork me on GitHub

每日学习记录20230316_转录组测序数据分析

20230316:转录组测序

  1. 转录组测序数据分析
    最根本的是基础知识,不然给你数据你都不知道是干啥的.要多看综述,并且要多看几遍.

    1. 下载GEO数据之前,需要先下载参考基因组数据.可以在三个平台上下载:ucsc,ncbi和ensemble,使用下面的检索式在搜索引擎中检索:
      hg38 ftp ucsc

      就得到比如下面的网址:https://hgdownload.cse.ucsc.edu/goldenpath/hg38/bigZips/
      以及下面的网站:https://useast.ensembl.org/info/data/ftp/index.html,及截图
      image-20230317081944024

      选DNA就是去下载FASTA文件,要下载toplevel的那个.这些FASTA文件都有不一样,对于sequence type分类,有dna,dna_rm和dna_sm三种.如果是dna_rm,那么它的重复序列会被N来代替,如果是dns_sm,那么会使用小写字母来代替重复序列.dna的类型,那就是没有这些处理的.我们一般下载dna的就可以.
      点GTF就是去下载基因注释文件,全称为gene transfer format,需要下载结尾带chr的.Regulation是去下载promoter和enhancer的数据.
      因为做的是有参转录组,所以参考基因组和注释文件非常重要,需要明白去哪里找和怎么用.

posted @ 2023-04-11 08:49  Mo槑  阅读(53)  评论(0编辑  收藏  举报