随笔分类 -  生信学习

转载:ReportLab生成带表格和图文的PDF
摘要:转载来自于:https://zhuanlan.zhihu.com/p/456486769 龙在天涯 项目环境: 环境:Anaconda Python 3.10 编辑器:PyCharm 2021.2.3 Packages:Reportlab 3.6.2 ReportLab简介 “This is a s 阅读全文
posted @ 2023-12-08 14:01 焦糖可丽饼 阅读(232) 评论(0) 推荐(0)
excel常用公式
摘要:当想要多个数字只保留固定几位小数时,公式floor(B2,0.01)得到小数后两位 阅读全文
posted @ 2022-03-14 21:01 焦糖可丽饼 阅读(87) 评论(0) 推荐(0)
linux改名字和截取部分文件名
摘要:来源于: https://www.cnblogs.com/lyq863987322/p/8004618.html https://www.cnblogs.com/ApolloZ/p/11618303.html#:~:text=linux%20%E6%8F%90%E5%8F%96%E6%96%87%E 阅读全文
posted @ 2022-03-01 22:32 焦糖可丽饼 阅读(1580) 评论(1) 推荐(0)
重复行
摘要:去除重复行sort file |uniq查找非重复行sort file |uniq -u查找重复行sort file |uniq -d统计sort file | uniq -c 阅读全文
posted @ 2022-02-11 22:00 焦糖可丽饼 阅读(26) 评论(0) 推荐(0)
linux正则表达式
摘要:grep 1.搜寻特定字符串"the"注: n为显示行号 复制代码 代码如下: # grep -n 'the' regular_express.txt 2.反向搜寻特定字符串"the" 复制代码 代码如下: # grep -vn 'the' regular_express.txt 3.取得任意大小写 阅读全文
posted @ 2021-12-11 10:16 焦糖可丽饼 阅读(300) 评论(0) 推荐(0)
mafft+phylosuite+raxml
摘要:构建系统发育树 有参考《Genomes of Subaerial Zygnematophyceae Provide Insights into Land Plant Evolution》 最后决定用mafft+phylosuite+raxml 首先需要将序列进行比对 在这里使用mafft conda 阅读全文
posted @ 2021-11-29 22:05 焦糖可丽饼 阅读(1771) 评论(0) 推荐(0)
如何快速统计基因组染色体长度
摘要:下载pyfaidx pip install pyfaidx faidx all.fa -i chromsizes > all.size 得到的图 阅读全文
posted @ 2021-11-27 10:35 焦糖可丽饼 阅读(171) 评论(0) 推荐(0)
一些实用软件
摘要:蛋白去重:cd-hit cd-hit -i pro.fa -o new.fa -c 0.9 -aS 0.8 -d 0 阅读全文
posted @ 2021-11-26 15:09 焦糖可丽饼 阅读(40) 评论(0) 推荐(0)
基因组结构性变异检测的方法及DNA-seq(转载)
摘要:人类基因组中的变异和人类的演化、疾病风险等方面都有着密切的联系。当前二代短读长高通量测序技术(NGS),虽然能够让测序成本大大降低,但这种短读长的测序方法也给基因组的变异检测(特别是结构性变异检测)带来了不小的挑战。SNP和Indel大家应该都见得比较多了,因此在这篇文章里我将主要讨论常见结构性变异 阅读全文
posted @ 2021-11-19 09:24 焦糖可丽饼 阅读(1001) 评论(0) 推荐(0)
本地blast
摘要:makeblastdb -in ref.nbs.plant.fa -dbtype prot -out blastdb blastp -num_threads 20 -db blastdb -query Arabidopsis_thaliana.TAIR10.pep.all.fa -outfmt 7 阅读全文
posted @ 2021-11-18 23:23 焦糖可丽饼 阅读(62) 评论(0) 推荐(0)
构建hmm模型
摘要:下载植物gff、cds、dna、pep pfam中下载hmm模型 搜索基因家族并以1e-20筛选 hmmsearch --cut_tc --domtblout NBS-ABC.out NBS-ARC.hmm Arabidopsis_thaliana.TAIR10.pep.all.fa grep -v 阅读全文
posted @ 2021-11-18 23:18 焦糖可丽饼 阅读(603) 评论(0) 推荐(0)
eQTL(转载)
摘要:首先QTL是数量性状位点,比如身高是一个数量性状,其对应的控制基因的位点就是一个数量性状位点,而eQTL就是控制数量性状表达位点,即能控制数量性状基因(如身高基因)表达水平高低的那些基因的位点。 数量性状基因座:控制数量性状的基因在基因组中的位置称数量性状基因座。常利用DNA分子标记技术对这些区域进 阅读全文
posted @ 2021-11-18 17:43 焦糖可丽饼 阅读(959) 评论(0) 推荐(0)
RNA-seq比对组装与定量软件现状(转载)
摘要:又是一篇转载,最近在学相关知识 RNA测序并不能直接使用DNA测序常用的BWA、Bowtie等比对软件,这是由于真核生物内含子的存在,导致测到的reads并不与基因组序列完全一致(如下图所示),因此需要使用Tophat/HISAT/STAR等专门为RNA测序设计的软件进行比对。 基因组比对: Top 阅读全文
posted @ 2021-11-18 17:16 焦糖可丽饼 阅读(582) 评论(0) 推荐(0)
快速下载sra文件
摘要:中午试了很久aspera下载ncbi的数据,但是ncbi上的网址已经在2019年后不能用了 所以改成ena的网址,可以实现快速下载 将需要下载的文献在 https://www.ebi.ac.uk/ena/browser/home 找到下载地址 整理成这样的格式:era-fasp@fasp.sra.e 阅读全文
posted @ 2021-11-17 23:08 焦糖可丽饼 阅读(191) 评论(0) 推荐(0)
完整转录组分析(整理)
摘要:转载来自https://zhuanlan.zhihu.com/p/393674599 写的非常好 怕找不到留着自己看!如果作者不同意我会删除。 前言 接下来我们要介绍的是 RNA-seq 数据的处理分析流程,根据 RNA-seq 测序技术的不同,可以分为三种: Stark et al. Nat Re 阅读全文
posted @ 2021-11-17 23:05 焦糖可丽饼 阅读(13377) 评论(0) 推荐(1)
rsem对转录本进行定量
摘要:最近在研究转录本,现在在下载数据,想起来自己有一个博客,就暂且来这里更新一下内容。 要想对转录本进行定量,首先需要下载它的转录组数据,将别人上传的SRR文件的名字整理在wheat.txt中,引用 prefetch --option-file wheat.txt 下载后通过sratoolkits将sr 阅读全文
posted @ 2021-11-14 20:48 焦糖可丽饼 阅读(1231) 评论(0) 推荐(0)