随笔分类 - 工具
摘要:## 环境依赖 ``` sudo yum update -y && \ yum groupinstall -y 'Development Tools' && \ yum install -y \ openssl-devel \ libuuid-devel \ libseccomp-devel \ w
阅读全文
摘要:本地上传测序文件到Linux系统,做md5时发现有少数文件失败。 $ cat md5.check 84305_FDSW190448400-1a_1.fq.gz: OK 84305_FDSW190448400-1a_2.fq.gz: FAILED md5sum: WARNING: 1 computed
阅读全文
摘要:爱达荷大学的统计学顾问Julia Piaskowski总结的关于R包在农业研究领域应用的一个概括。 关于Julia Piaskowski:https://jpiaskowski.gitlab.io/ 来自agstats_2022_poster 更多信息: https://agstats.io/eve
阅读全文
摘要:当我对两个基因型文件位置取交集,并重新生成两个vcf: $ bcftools view -R overlap.lst variant.filter.vcf.gz -Oz -o 300.vcf.gz 出现如下错误: $ tabix 300.vcf.gz [E::hts_idx_push] Unsort
阅读全文
摘要:Xshell是我用过最好的终端访问服务器的软件,搭配Xftp文件传输,体验很好。不过6及以后版本就收费了,虽然对于学校和家庭使用可以免费,但每次都要强制升级。 Xshell6最多支持4个session。Xshell7可以无限session,但vim编辑文本时,无法通过鼠标回滚到命令行,从而无法复制命
阅读全文
摘要:如题双击无任何反应,以管理员身份也是。 以为是版本问题,结果v6和v7都不行。 以为是win10自带防护拦截,允许应用通过防火墙,结果还是不行。 最后发现是电脑装了火绒,退出后,双击就好了。 如果你装了电脑管家、360,同样退出就好。如果你的其他应用软件也是双击无反应,同理。 参考:https://
阅读全文
摘要:1. 原版 安装比较简单。 wget https://reich.hms.harvard.edu/sites/reich.hms.harvard.edu/files/inline-files/XPCLR.tar tar xvf XPCLR.tar 直接运行bin下的XPCLR即可,若不能运行,则编译
阅读全文
摘要:原始帖 Admixture做群体结构分析是好用,但也有一些不顺手的地方。最大的问题是不支持非整数的染色体号! 相信我们手里绝大部分vcf或plink格式文件,染色体ID基本是文本类型的吧。注意plink处理时加上-allow-extra-chr,若染色体数超过人类,可使用--chr-set设置。 s
阅读全文
摘要:需求 想要把在linux终端操作的习惯改到本机上来。理由如下: linux下的vim对于编程调试不是很方便; 编程与命令不能很好链接,经常要多开几个window或sessions; vim的自动补全不太好使(应该是我没修炼到家); xshell最近更新的版本导致了之前的习惯操作受到严重限制(如vim
阅读全文
摘要:不同基因组版本的位置(坐标)对应关系,在数据分析环节经常用到。 位置对应关系通常通过比对来获取,而信息一般存储在chain文件中。 对于人类、小鼠等模式生物而言,UCSC已经提供了不同版本的chain文件。 对于非模式生物,往往需要先自己制作chian文件,再通过ncbi的remap,UCSC的li
阅读全文
摘要:问题 Outlook 2016一直好好地,最近打开弹窗“需要更新才能启动”,收不了邮件。 解决 在Microsoft官网下载KB5002051补丁,安装重启后问题解决。 https://docs.microsoft.com/en-us/officeupdates/outlook-updates-ms
阅读全文
摘要:GMOD(Generic Model Organism Database) 是专为生物学家创建的开源项目,生物学家用作存储库和工具的交互应用程序和数据库的集合。 连通性是GMOD的关键。生物信息学应用程序和数据库大量产生,但其中许多工具很少使用,因为用户可能缺乏将工具连接到他们数据所需的资源或专业知
阅读全文
摘要:问题描述 客户一个测序原始数据在百度网盘上待分析。一般思路是下载到本地,再转移到服务器。但这样相当于数据转移两次,如果客户不给你账号密码,可能还得转移三次。而百度网盘这尿性,下载会很慢很慢。 解决方案 网上查了下,百度网盘提供了一个开放的api,使用服务器的命令行即可直接下载数据。 pip inst
阅读全文
摘要:BQSR vs. VQSR BQSR (Base Quality Score Recalibration)表示碱基质量值重校正。简言之,这是一个检测系统性错误的数据预处理步骤,用于检查测序仪估计每个碱基检测的准确性。 主要考虑了碱基在reads中的位置、上下文环境和原始质量值这三个因素,首先计算出原
阅读全文
摘要:最近调研,总结了一些公司推出的基因组计算加速产品和方案。简单罗列下几个平台,主要针对GATK流程加速。 腾讯云:双螺旋 2017年发布,一体化的数据管理PaaS平台,可进行传、存、算、管等工作。 加速原理:FPGA极光异构系统。 30x WGS运行时间:2.8h。 http://www.baiema
阅读全文
摘要:1. 简介 Web Scraper是Chrome/Firefox浏览器插件,跨平台使用。 优点:使用简单,无需编程,鼠标点点就可;轻量快速爬取。 缺点:小数据量;不能爬图片;不能中止;整体较慢(网速影响可能不稳定);爬取结果乱序。 2. 基础 chrome应用商店安装插件需要fanqiang,但凡用
阅读全文
摘要:在对动植物杂交种(或F1子代)的基因组和转录组的关联研究中,要回答这么一个问题:基因组变异到底与基因表达有什么关系? 这个问题很难,因为涉及影响基因表达调控的因素可太多了!多少科研人员围绕着这个问题研究毕生。 但不可避免的要做等位基因特异性表达(allele-specific expression,
阅读全文
摘要:MP作为国内植物领域神刊,发展非常之快。开年之际,国人就已发表好几项卓越成果。这里摘取几项跟分子育种相关的研究,涉及工具、方法和数据库等资源。 Mol Plant | 华中农大杨庆勇团队发布油菜群体变异数据库,架起基因型与表型的桥梁、助力油菜分子育种 BnVIR: bridging the geno
阅读全文
摘要:软件的安装 Python版McScan(jcvi工具包):https://github.com/tanghaibao/jcvi 以前只有python2,现在已有python3版本,建议用py3。安装可用pip: pip install jcvi ##或开发版 pip install git+git:
阅读全文
摘要:1. 矩阵相关性计算方法 base::cor/cor.test R基础函数cor或cor.test都可计算相关性系数,但cor可直接计算矩阵的相关性,而cor.test不可。 两者计算非矩阵时,cor仅得到相关系数,而cor.test还能得到pvalue。 library(ggplot2) cor(
阅读全文