导航

摘要: 我是一名普通的研究生,对生信和IT感兴趣,现在正在自学。 随笔中出现的各种教程和流程大部分都是借鉴和摘抄各种大神前辈的,然后加一点自己的理解,并不是原创。 之所以写随笔,是因为随笔任何人随时都能看见,这样一来是想学习开源开放精神;二来也是希望自己的学习经历可以给后来学习的人提供一点微不足道的帮助。如 阅读全文

posted @ 2018-06-07 11:44 微凉charles 阅读(398) 评论(0) 推荐(0) 编辑

2018年7月3日

摘要: 作业要求: 我们统一选择p<0.05而且abs(logFC)大于一个与众的基因为显著差异表达基因集,对这个基因集用R包做KEGG/GO超几何分布检验分析。 然后把表达矩阵和分组信息分别作出cls和gct文件,导入到GSEA软件分析。 基本任务是完成这个分析。 【1】环境准备 【2】gene_id 转 阅读全文

posted @ 2018-07-03 21:56 微凉charles 阅读(2520) 评论(0) 推荐(0) 编辑

摘要: 作业要求: 使用R语言,载入表达矩阵,然后设置好分组信息,统一用DEseq2进行差异分析,当然也可以走走edgeR或者limma的voom流程。 基本任务是得到差异分析结果,进阶任务是比较多个差异分析结果的异同点。 【1】安装DESeq2 DESeq2对于输入数据的要求: 1.DEseq2要求输入数 阅读全文

posted @ 2018-07-03 21:47 微凉charles 阅读(9573) 评论(0) 推荐(0) 编辑

摘要: 作业要求: 实现这个功能的软件也很多,还是烦请大家先自己搜索几个教程,入门请统一用htseq-count,对每个样本都会输出一个表达量文件。 需要用脚本合并所有的样本为表达矩阵。参考:生信编程直播第四题:多个同样的行列式文件合并起来 对这个表达矩阵可以自己简单在excel或者R里面摸索,求平均值,方 阅读全文

posted @ 2018-07-03 21:05 微凉charles 阅读(3443) 评论(0) 推荐(0) 编辑

2018年6月30日

摘要: 作业要求: 比对软件很多,首先大家去收集一下,因为我们是带大家入门,请统一用hisat2,并且搞懂它的用法。 直接去hisat2的主页下载index文件即可,然后把fastq格式的reads比对上去得到sam文件。 接着用samtools把它转为bam文件,并且排序(注意N和P两种排序区别)索引好, 阅读全文

posted @ 2018-06-30 22:26 微凉charles 阅读(6117) 评论(0) 推荐(0) 编辑

摘要: 作业要求: 在UCSC下载hg19参考基因组,我博客有详细说明,从gencode数据库下载基因注释文件,并且用IGV去查看你感兴趣的基因的结构,比如TP53,KRAS,EGFR等等。 作业,截图几个基因的IGV可视化结构!还可以下载ENSEMBL,NCBI的gtf,也导入IGV看看,截图基因结构。了 阅读全文

posted @ 2018-06-30 21:27 微凉charles 阅读(16154) 评论(0) 推荐(0) 编辑

2018年6月22日

摘要: 非原创 参考资料: 一文掌握GO和pathway分析 - 生物信息学讨论版 -丁香园论坛http://www.dxy.cn/bbs/thread/34904124#34904124 GO富集 GO是Gene ontology的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标 阅读全文

posted @ 2018-06-22 11:59 微凉charles 阅读(24391) 评论(0) 推荐(0) 编辑

摘要: Python网络爬虫与信息提取 目标:掌握定向网络数据爬取和网页解析的基本能力。 the website is the API 课程分为以下部分: 1、requsets库(自动爬取HTML页面、自动网络请求提交) 2、robots.txt规则(网络爬虫排除标准)(合理合法的使用爬虫) 3、beaut 阅读全文

posted @ 2018-06-22 11:59 微凉charles 阅读(1368) 评论(0) 推荐(0) 编辑

摘要: 二代测序原理: 1、DNA待测文库构建。 超声波把DNA打断成小片段,一般200--500bp,两端加上不同的接头2、Flowcell。一个flowcell,8个channel,很多接头3、桥式PCR扩增。每个DNA片段将在各自位置集中成束,每一束含有单个DNA模板的很多拷贝,目的:将碱基的信号强度 阅读全文

posted @ 2018-06-22 11:59 微凉charles 阅读(6427) 评论(0) 推荐(0) 编辑

摘要: 操作:需要用安装好的sratoolkit把sra文件转换为fastq格式的测序文件,并且用fastqc软件测试测序文件的质量 作业:理解测序reads,GC含量,质量值,接头,index,fastqc的全部报告,搜索中文教程 具体步骤 【1】SRA文件转换成fastq文件 单个文件转换 多个文件批量 阅读全文

posted @ 2018-06-22 11:59 微凉charles 阅读(9668) 评论(0) 推荐(0) 编辑

2018年6月11日

摘要: 作业要求: 本流程学习的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 数据地址:GSE8 阅读全文

posted @ 2018-06-11 14:25 微凉charles 阅读(1994) 评论(0) 推荐(0) 编辑

2018年6月4日

摘要: 一、Python内部执行过程 1、Python的后缀名可以是任意? print("hello,world") 保存成 .py / .txt / .sb / .aaa 都可以用在cmd用Python执行 2、导入模块时,如果不是.py文件,就会报错 3、以后文件后缀名都要是 .py 二、解释器 指定由 阅读全文

posted @ 2018-06-04 21:44 微凉charles 阅读(243) 评论(0) 推荐(0) 编辑

摘要: 编程语言介绍 开发 系统软件开发:Windows,iOS 应用软件开发:淘宝、网易云音乐、QQ 开发语言 高级语言:Python,Java,PHP, c#,GO,ruby,c++ > 字节码 低级语言:c, 汇编 >机器码 注意: 1、C语言: 代码编译得到机器码 ,机器码在处理器上直接执行,每一条 阅读全文

posted @ 2018-06-04 19:47 微凉charles 阅读(293) 评论(0) 推荐(0) 编辑