摘要:
参考:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html 语法格式 class pandas.DataFrame(data=None, index=None, columns=None, d 阅读全文
摘要:
在线性回归模型中,拟合函数$h(x)$输出一组连续型标签值。当标签是离散型变量,或者说想做分类任务,可通过引入联系函数(link function), 得到一个“广义线性模型”实现分类。 二分类模型 对于二分类模型,Sigmoid函数正是这样一个联系函数: $y=\frac{1}{1+e^{-h(x 阅读全文
摘要:
基本形式 线性回归(linear regression)通过学习获得一个线性模型以尽可能准确地预测实际标签值。对于具有m个样本的数据集,给定$n$个特征,其线性回归模型如下: $h(x)=\theta_0+\theta_1x_1+\theta_2x_2+...+\theta_nx_n=\sum\li 阅读全文
摘要:
参考:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html 在了解逻辑回归原理(见逻辑回归原理总结)的基础上,进一步对sklearn库中的LogisticRegre 阅读全文
摘要:
语法格式 numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0) 常用参数解释: start: 序列的起始值 stop: 序列的终止值 num: 要生成的样本数量。默认值是50。必须是 阅读全文
摘要:
1. 在PDB文件中,ATOM模块是记录蛋白质分子中原子坐标信息的模块,每一行代表一个原子的坐标信息。 如下图所示是pdb文件的部分内容: 第一列:记录原子的标识号;第二列:原子序号;第三列:原子名称;第四列:残基名称;第五列:链ID;第六列:残基序号;第7-9列:原子坐标;第10列:occupan 阅读全文
摘要:
参考:https://numpy.org/doc/stable/reference/generated/numpy.zeros.html 语法格式 numpy.zeros(shape, dtype=float, order='C', *, like=None) 常用参数解释: shape: 接受整数 阅读全文
摘要:
参考:https://biopython.org/wiki/Alphabet 作用: 1. 记录序列的分子类型(DNA, RNA或蛋白质), 2. 在序列、alignment、motif等中声明预期的字符。 在Biopython 1.78及以后的版本中删除了Bio.Alphabet模块。 #old 阅读全文
摘要:
参考:http://biopython.org/DIST/docs/tutorial/Tutorial.html 1.构建Seq()对象 from Bio.Seq import Seq myseq = Seq("AGTACACTCA") print(myseq) # AGTACACTCA print 阅读全文
摘要:
参考:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html 目的:将数组或矩阵分割为随机的训练和测试子集。 语法格式 sklearn.model_selectio 阅读全文