上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 13 下一页

2021年11月30日

R类别比较型图-柱形图系列

摘要: ggplot2绘制柱形图和条形图,X轴变量默认按照输入的数据顺序绘制,Y轴变量和图例变量默认按照字母顺序绘制。因此在绘图前先排序。 geom_bar绘制柱形图包括单数据系列柱形图、多数据系列柱形图、堆积柱形图、百分比推挤柱形图。 X轴一般是类别型()和序数型(按顺序绘制),Y轴为数值型。 当X是类别 阅读全文

posted @ 2021-11-30 09:06 BioinformaticsMaster 阅读(188) 评论(0) 推荐(0) 编辑

2021年11月25日

测试csvkit 操作csv

摘要: 安装: virtualenv csvhandlesource csvhandle/bin/activate pip install csvkit cd csvhandle mkdir testcd test 测试:软件在对转码方面做的不到位。 ../bin/in2csv 不能转换含中文的excel到 阅读全文

posted @ 2021-11-25 19:45 BioinformaticsMaster 阅读(89) 评论(0) 推荐(0) 编辑

管理不同版本的python用pyenv, 管理环境变量装包用virtualenv

摘要: 1. 管理不同版本的python,如python2,python3。 python版本维度。 pythonbrew不再维护 用pyenv brew install pyenv 2.管理同一python版本下不同的环境变量。 项目维度: 2.1 virtualenv 所要解决的是同一个库(包)不同版本 阅读全文

posted @ 2021-11-25 16:57 BioinformaticsMaster 阅读(149) 评论(0) 推荐(0) 编辑

2021年11月23日

孟德尔随机化MR

摘要: 软件包: install.packages("devtools") library(devtools) install_github("MRCIEU/TwoSampleMR") Ref: https://www.cnblogs.com/chenwenyan/p/11224609.html 阅读全文

posted @ 2021-11-23 14:29 BioinformaticsMaster 阅读(352) 评论(0) 推荐(0) 编辑

2021年11月9日

find . -type f -exec ls -l {} \;

摘要: find 命令 查找,搭配exec 对查找到的文件操作。 -exec 后跟command,终止以;结尾,考虑到分号在不同系统中的不同含义,所以习惯用\;转译。 花括号{}指代前面find查找到文件。 例子: find . -type f -exec ls -l {} \; find -type f 阅读全文

posted @ 2021-11-09 10:41 BioinformaticsMaster 阅读(231) 评论(0) 推荐(0) 编辑

2021年11月5日

R 读取, 列,某行,操作,保存

摘要: 导入数据,观察数据,操作数据,可视化展示,关闭数据 data<-read.csv("xx.csv",header=1)#第一行是header,不是值 。 取数据时候,较有用的参数还有stringsasfactor=Fasle,这样就不会把所有的字符型变量转换成Factor因子。因子是不能用与字符串操 阅读全文

posted @ 2021-11-05 13:27 BioinformaticsMaster 阅读(8211) 评论(0) 推荐(0) 编辑

2021年10月1日

apply函数对行/列运算

摘要: apply(X,MARGIN,FUN,...) 对矩阵、数据库、数组按行或列进行迭代计算,返回向量或数组或值列表。 apply系列函数有效替代R中比较慢的for循环。 X: 输入的数组、矩阵,如果是数据框会自动转换成矩阵 MARGIN:按行计算或按列计算,1表示按行,2表示按列。 FUN:调用的函数 阅读全文

posted @ 2021-10-01 16:07 BioinformaticsMaster 阅读(778) 评论(0) 推荐(0) 编辑

表格拼接,融合

摘要: cbind(df1,df2) 横向添加表格,表格变宽,增加列数 rbind(df1,df2,...) 纵向合并多个数据集,表格变长,增加行数, 类似cat命令,要求列数相同 例子: 表格融合:针对数据框没有很好的保持一致。可用函数R内置的merge() 和dplyr的_join()函数。注:merg 阅读全文

posted @ 2021-10-01 14:14 BioinformaticsMaster 阅读(179) 评论(0) 推荐(0) 编辑

表格转换,多行聚集成列,长列转换成多行

摘要: 我从中学开始就立体,较多维的数据理解不强,所以这部分进度慢些很正常 R ggplot2绘图常用一维数据列表的数据框,所以常用到多行聚为列这个功能。 减列数,减维: 常用包:reshape2,tidyr以及聚集了tidyr等包的tidyverse。 创建例子df<-data.frame(x=c("A" 阅读全文

posted @ 2021-10-01 10:42 BioinformaticsMaster 阅读(73) 评论(0) 推荐(0) 编辑

2021年9月30日

表格转换,多行聚集成列,长列转换成多行

摘要: 练 R ggplot2绘图常用一维数据列表的数据框,所以常用到多行聚为列这个功能。 减列数,创建一维: 常用包:reshape2,tidyr以及聚集了tidyr等包的tidyverse。 创建例子df<-data.frame(x=c("A","B","C"),"2010"=c(1,3,4),'201 阅读全文

posted @ 2021-09-30 22:42 BioinformaticsMaster 阅读(74) 评论(0) 推荐(0) 编辑

2021年8月27日

记第一次写数据库文章总结

摘要: 最近写了一篇数据库的文章,目前已经投递,处于awating decision阶段。 写之前首先对要写的对象尽可能的收集资料,更全面的掌握对象。 然后可以试着写一篇summary,包括背景、当前的缺口,引出本文、描述数据库内容,数据库功能,数据库意义。这样全方位掌握自己要写文章的全局。 然后看同类数据 阅读全文

posted @ 2021-08-27 15:24 BioinformaticsMaster 阅读(72) 评论(0) 推荐(0) 编辑

2021年5月20日

免疫 TCR BCR 病毒滴度

摘要: 病毒滴度:病毒的毒力,毒价,衡量病毒滴度的单位有最小致死量(MLD)、最小感染量(MID)和半数致死量(LD50),其中LD50最常用,指在一定时间内能使半数试验动物致死的病毒量。 免疫,即身体对感染有抵抗能力。 人体内三道免疫防线: 1. 皮肤和黏膜构成 2.杀菌物质和吞噬细胞 3.特异性免疫。 阅读全文

posted @ 2021-05-20 15:46 BioinformaticsMaster 阅读(691) 评论(0) 推荐(0) 编辑

2021年5月18日

Genome-wide Study Identifies Association between HLA-B*55:01 and Self-Reported Penicillin Allergy

摘要: 基因型+表型的 样本多: 52,000的Estonian Biobank,500,500的UK biobank,67,323的BioVU。还有用于验证的样本集-1.12Million的23andMe。每个人群都包含base\control 方法: 在三个人群中各自用SAIGE开展GWAS分析->调整 阅读全文

posted @ 2021-05-18 15:14 BioinformaticsMaster 阅读(178) 评论(0) 推荐(0) 编辑

2021年5月11日

LD plot

摘要: 连锁不平衡 linkage disequilibrium (LD) 又称为等位基因关联(allelic association) 广泛的遗传关联研究依赖genetic marker和disease locus的连锁不平衡(linkage disequilibrium,LD) http://www.v 阅读全文

posted @ 2021-05-11 10:16 BioinformaticsMaster 阅读(2000) 评论(0) 推荐(0) 编辑

2021年4月27日

beta p-value SE

摘要: Beta value Beta值(β) effect size 线性回归的参数https://www.mv.helsinki.fi/home/mjxpirin/GWAS_course/material/GWAS2.html Hello Mohsin, Cohen's f-squared would 阅读全文

posted @ 2021-04-27 10:07 BioinformaticsMaster 阅读(957) 评论(0) 推荐(0) 编辑

上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 13 下一页

导航