03 2023 档案
摘要:1. 在PDB文件中,ATOM模块是记录蛋白质分子中原子坐标信息的模块,每一行代表一个原子的坐标信息。 如下图所示是pdb文件的部分内容: 第一列:记录原子的标识号;第二列:原子序号;第三列:原子名称;第四列:残基名称;第五列:链ID;第六列:残基序号;第7-9列:原子坐标;第10列:occupan
阅读全文
摘要:参考:https://numpy.org/doc/stable/reference/generated/numpy.zeros.html 语法格式 numpy.zeros(shape, dtype=float, order='C', *, like=None) 常用参数解释: shape: 接受整数
阅读全文
摘要:参考:https://biopython.org/wiki/Alphabet 作用: 1. 记录序列的分子类型(DNA, RNA或蛋白质), 2. 在序列、alignment、motif等中声明预期的字符。 在Biopython 1.78及以后的版本中删除了Bio.Alphabet模块。 #old
阅读全文
摘要:参考:http://biopython.org/DIST/docs/tutorial/Tutorial.html 1.构建Seq()对象 from Bio.Seq import Seq myseq = Seq("AGTACACTCA") print(myseq) # AGTACACTCA print
阅读全文
摘要:参考:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html 目的:将数组或矩阵分割为随机的训练和测试子集。 语法格式 sklearn.model_selectio
阅读全文
摘要:参考:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.values.html 作用:返回DataFrame的numpy.ndarray。只有DataFrame中的值将被返回,轴标签将被删除。 im
阅读全文
摘要:介绍 函数Bio.SeqIO.parse()用于读取序列数据作为SeqRecord对象,实际上是返回一个SeqRecord对象的迭代器。这个函数需要两个参数,1)第一个参数是读取数据的句柄或文件名;2)第二个参数是一个小写字符串,指定序列格式,支持的格式list见http://biopython.o
阅读全文
摘要:参考:https://docs.python.org/zh-cn/3/library/copy.html 介绍 Python copy模块包括copy()和deepcopy()两函数。 copy.copy(x): 返回 x 的浅层(shallow)复制。 copy.deepcopy(x[, memo
阅读全文
摘要:import pandas as pd d1 = [[3,"negative",2],[4,"negative",6],[11,"positive",0],[12,"positive",2], [14,"positive",2]] df1 = pd.DataFrame(d1, columns=["x
阅读全文
摘要:参考:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.shape.html import pandas as pd d1 = [[3,"negative",2],[4,"negative",6],
阅读全文
摘要:参考:https://numpy.org/doc/stable/reference/generated/numpy.arange.html 语法格式 numpy.arange([start, ]stop, [step, ]dtype=None, *, like=None) 代码示例 >>> impo
阅读全文
摘要:pandas.DataFrame.sample-从DataFrame或Series对象中随机取样 DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None, ignore
阅读全文
摘要:语法格式 pandas.concat(objs, *, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=Tru
阅读全文
摘要:import pandas as pd df=pd.DataFrame({"A":[2,3,4,5],"B":[7,9,6,6]}) print(df) id = [i for i, j in enumerate(df['B']) if j == 6] #if语句是可选项 print(id) 输出结
阅读全文
摘要:语法格式 enumerate(iterable, start=0) iterable:支持迭代的对象,包括字符串、列表、数组和字典等 start -- 下标起始位置的值,默认为0 代码示例 str1="abcd" for i, j in enumerate(str1): print(i, j) 输出
阅读全文
摘要:参考:https://www.rosettacommons.org/demos/latest/tutorials/scoring/scoring 介绍 Rosetta有一个被称为ref2015(默认打分函数)的优化能量函数或打分函数,用于计算由L-氨基酸组成的球状蛋白质中所有原子相互作用的能量。还有
阅读全文