随笔分类 - python
CPTAC CT数据下载过程记录
摘要:下载官网提供的客户端总也下不好 所以用代码下,确保挂了梯子 下好pycharm 或者其他的python编程IDE。两行代码,阅读下载的log日志,如果网速影响导致没有下全,重复运行几次,他会再次把没有下好的数据重新下载。 点击查看代码 from tcia_utils import nbia df =
阅读全文
linux上批量将pdf转为png文件
摘要:点击查看代码 import fitz # pip install pymupdf -i https://pypi.tuna.tsinghua.edu.cn/simple/ import os def pdf2img(pdf_path, zoom_x, zoom_y): """ 参数说明 :param
阅读全文
批量修改Fasta文件中序列的名称
摘要:比如一个Fasta文件的内容如下: seq001|aaa ATCGGGG seq002|bbb AAAATTTT 删除序列名称中“|”后的内容,只保留seq001, seq002这样的名称 点击查看代码 #!/usr/bin/env python import sys import pysam wi
阅读全文
最长蛋白序列和最长转录本提取
摘要:#### 1. 第一种数据格式为protein.fa(translated.fa) 和 gene.gtf文件,序列信息如下 : import os import shutil list1 =[] list2 = [] dd = '' for root,dirs,files in os.walk(dir): for file in fil
阅读全文
提取最长转录本|多物种批量操作版
摘要:点击查看代码 #!/usr/bin/env python # -*- coding=utf-8 -*- ''' 提取序列文件中最长的转录本ID 需要修改######位置的参数 以及 open的目录 ''' import sys import re Fasta=open("/Business/psn_
阅读全文
浙公网安备 33010602011771号