摘要: 链接附带的是ucsc各种格式文件的说明,以后遇到新类型的文件可以先来这里看看! https://www.genome.ucsc.edu/FAQ/FAQformat.html 阅读全文
posted @ 2017-11-24 10:25 生信老码农 阅读(533) 评论(0) 推荐(0) 编辑
摘要: sparse函数 功能:Create sparse matrix-创建稀疏矩阵 用法1:S=sparse(X)——将矩阵X转化为稀疏矩阵的形式,即矩阵X中任何零元素去除,非零元素及其下标(索引)组成矩阵S。 如果X本身是稀疏的,sparse(X)返回S。 例如: A= 0 2 0 4 0 6 7 0 阅读全文
posted @ 2017-11-22 22:51 生信老码农 阅读(10947) 评论(0) 推荐(0) 编辑
摘要: 函数原型: #include “stdio.h” FILE *popen( const char* command, const char* mode ) 参数说明: command: 是一个指向以 NULL 结束的 shell 命令字符串的指针。这行命令将被传到 bin/sh 并使用 -c 标志, 阅读全文
posted @ 2017-11-16 18:07 生信老码农 阅读(2921) 评论(0) 推荐(0) 编辑
摘要: 文件 文件的基本概念 所谓“文件”是指一组相关数据的有序集合。 这个数据集有一个名称,叫做文件名。实际上在前面的各章中我们已经多次使用了文件,例如源程序文件、目标文件、可执行文件、库文件 (头文件)等。文件通常是驻留在外部介质(如磁盘等)上的,在使用时才调入内存中来。从不同的角度可对文件作不同的分类 阅读全文
posted @ 2017-11-16 16:42 生信老码农 阅读(15878) 评论(0) 推荐(1) 编辑
摘要: stat函数讲解表头文件: #include <sys/stat.h> #include <unistd.h>定义函数: int stat(const char *file_name, struct stat *buf);函数说明: 通过文件名filename获取文件信息,并保存在buf所指的结构体 阅读全文
posted @ 2017-11-16 16:30 生信老码农 阅读(9730) 评论(0) 推荐(0) 编辑
摘要: 肿瘤大数据挖掘中经常需要处理上百亿行的文本文件,这些文件往往高达数百GB,假如文件结构简单统一,那么用sed和awk 处理是非常方便和快速的。但有时候会遇到逻辑较为复杂的处理流程,这样我一般会用JAVA来处理。但由于JAVA是单线程的,因此对于实验室多核服务器来说,能充分有效的利用起每个核会方便不少 阅读全文
posted @ 2017-10-26 11:16 生信老码农 阅读(10418) 评论(0) 推荐(1) 编辑
摘要: 生信文章里面图片很多都是基于插画性质的质量图,最近写文章苦于找不到合适的素材,今天发现一个网站还不错,这里帖网址:http://www.zcool.com.cn/ http://ibaotu.com/ 阅读全文
posted @ 2017-09-29 09:43 生信老码农 阅读(268) 评论(0) 推荐(0) 编辑
摘要: 老板推荐了一个专门用来做基因表达定量(qPCR)的引物数据库,还蛮好用的,都是别人实验验证过的,感觉比自己设计的更靠谱一下,附上链接:https://pga.mgh.harvard.edu/primerbank/ 阅读全文
posted @ 2017-09-27 20:47 生信老码农 阅读(1312) 评论(0) 推荐(0) 编辑
摘要: ENCODE数据库用于存放基因组原件,所有的测序数据(原始数据以及每一步处理后的数据以及最终的结果)都是开放下载的。假如说去官网下载的话会比较麻烦,这里可以通过UCSC的数据库下载(真的是神器啊)!下面介绍方法: https://www.genome.ucsc.edu/ENCODE/download 阅读全文
posted @ 2017-09-21 12:03 生信老码农 阅读(1551) 评论(0) 推荐(0) 编辑
摘要: 有时候会用R语言写一下简单的脚本处理函数,加入需要调试的话可以按照下面的步骤进行: 先创建一个简单的函数,然后用debug() 函数对创建的fun()函数进行debug。这时控制台没有任何变化,但是当再次运行创建函数时会进入debug状态: 可以在debug状态查看变量值,单步运行。 键入n:运行下 阅读全文
posted @ 2017-07-05 10:28 生信老码农 阅读(1681) 评论(0) 推荐(0) 编辑