摘要:
把代码封装成函数的好处是可以重复使用该段代码,并且会使代码结构清晰 例如要计算chr1以及chr2染色体的GC含量,代码如下: 阅读全文
摘要:
argparse是python中用于传递和解析命令行参数的模块,例如: 从cmd输入命令行 E:\15_python\DEBUG>python fasta_argparse.py -avg -min_len 50 100 10 200 40 回车得到 total length:300.00avera 阅读全文
摘要:
以人类染色体个数为例: 通过range()函数快速生成一系列整数,将其一列表的形式存储;对其进行扩展;然后修改列表中的元素(染色体id),生成Chr_形式 cmd终端python代码如下: 用VSCode编写python 阅读全文
摘要:
对fasta文件genome_test.fa中的染色体序列进行反向互补,并输出到文件genome_test_RC.fa genome_test.fa >chr1ATATATATAT>chr2ATATATATATCGCGCGCGCG>chr3ATATATATATCGCGCGCGCGATATATATAT 阅读全文
摘要:
读取fasta文件genome_test.fa,并计算染色体总长,同时输出最长染色体编号、序列以及长度 fasta文件genom_test.fa的内容如下: >chr1ATATATATAT>chr2ATATATATATCGCGCGCGCG>chr3ATATATATATCGCGCGCGCGATATAT 阅读全文
摘要:
含有染色体长的文件chr_len.txt chr1 10chr2 20chr3 30chr4 40chr5 50 python脚本 #传递命令行参数 import sys # 导入模块 # 从命令行获取文件名称 f_chr_len = sys.argv[1] # 定义命令行参数,1表示变量1 # 打 阅读全文
摘要:
# 传递命令行参数 # 导入sys模块 import sys print(sys.argv) 命令行操作 python argv.py 10 20 30 40 50 回车输出 ['argv.py', '10', '20', '30', '40', '50'] # 方法一,删掉第0个元素 del(sy 阅读全文
摘要:
# 读取fasta # 解析每条序列的长度 chr_len = {'chr1':10,'chr2':20,'chr3':30,'chr4':40,'chr5':15} # 求和 total_len = sum(chr_len.values()) # 获取键用keys for chr in chr_l 阅读全文
摘要:
# 读取fasta # 解析每条序列的长度 chr_len = [10,20,30,40,50] # 求和 # 方法一:通过循环 total_len = 0 #定义total_len的初始长度 for len in chr_len: # 从列表chr_len中每次取一个值交给len total_le 阅读全文
摘要:
# 读取fasta # 解析每条序列的长度 chr1_seq = 'ATATATATAT' chr2_seq = 'ATATATATATCGCGCGCGCG' chr3_seq = 'ATATATATATCGCGCGCGCGATATATATAT' chr4_seq = 'ATATATATATCGCG 阅读全文