09 2023 档案
表达组都包括什么
摘要:表达组(expression profile)是指在一个生物体或细胞中的所有基因在特定时间和条件下的表达情况的总和。表达组研究的主要目标是了解基因的表达模式,特别是哪些基因在不同条件下的表达水平发生了变化。 其实就是mRNA分子被细胞中的核糖体(ribosome)解读,根据mRNA上的核酸序列合成蛋
阅读全文
转录组都有什么
摘要:转录组是指一个生物体内的所有转录本(RNA分子),也就是所有基因在特定时间和条件下的表达情况。转录组研究的目的是了解在特定生物样本中哪些基因被转录成RNA,以及它们的相对表达水平。 一个典型的转录组研究通常包括以下方面的内容: RNA提取: 从生物样本(通常是细胞或组织样本)中提取总RNA。总RNA
阅读全文
DataFrame创建
摘要:DataFrame是一个二维标签数据结构,有行和列 可以看作是一个excel表格 创建: 1,横向创建 这种就是字典的方式 什么时候需要这种呢? 需要字典进行映射,然后要将结果转excel。那就需要这种方式 2,列向创建 这种就是列表的方式
阅读全文
数据清洗
摘要:缺失值 判断各个单元格是否为空。 isnull() 判断各个单元格是否为空 删除包含缺失值的行 df.dropna(inplace=True) 填充缺失值 # 填充缺失值为指定值,例如0 df.fillna(0, inplace=True) # 或者填充缺失值为列的均值 df.fillna(df.m
阅读全文
监督学习-分类算法-KNN
摘要:定义:KNN最核心的功能“分类”是通过多数表决来完成的,具体方法是在待分类点的K个最近邻中查看哪个类别占比最多。哪个类别多,待分类点就属于哪个类别 如果选择K=3,那么模型将考虑目标数据点的3个最近邻居, 对于图像的分类。他的邻居是什么 每个图像样本通常会被表示为一个特征向量,其中每个特征可以代表图
阅读全文
非监督学习-聚类算法-Kmeans
摘要:K均值聚类算法是一种用于将数据集中的数据点分成不同组的方法。这些组通常称为簇。这个算法的核心思想是把相似的数据点放在同一个簇中,从而把数据分成几个组,每个组内的数据点彼此相似。 这是一个简单的K均值聚类过程: 选择簇的数量(K):首先,将数据分成k个簇。 随机选择K个点作为初始簇中心:从数据集中随机
阅读全文
监督学习-分类算法
摘要:分类算法是一类监督学习算法,用于将数据点分为预定义的类别或标签之一。在分类问题中,算法通过学习从已知输入数据到其对应类别的映射来训练模型,然后使用该模型来对新的、未标记的数据进行分类。分类问题通常涉及到预测离散的输出,即将数据分为几个互斥的类别之一。 以下是一些常见的分类算法: 逻辑回归(Logis
阅读全文
监督学习和非监督学习
摘要:总结来说,监督学习侧重于从带有标签的数据中学习预测模型,用于分类或回归等任务,而非监督学习侧重于从未标记的数据中发现数据的内在结构和模式。这两种学习方式在机器学习中都具有重要作用,具体选择哪种取决于任务的性质和数据的特点 监督学习(Supervised Learning): 任务:监督学习是一种有监
阅读全文
LSTM
摘要:LSTM(Long Short-Term Memory)是一种递归神经网络(Recurrent Neural Network,RNN)的变体,用于处理和建模序列数据,尤其在处理长序列时表现出色。它的设计目的是克服传统RNN架构中的梯度消失问题,以便更好地捕捉和记忆序列数据中的长期依赖关系。 LSTM
阅读全文
numpy是什么
摘要:numpy是什么 NumPy提供了numpy.array对象,它是一个由相同类型的元素组成的多维数组 numpy主要用来干什么 NumPy包含许多内置的数学函数,可以用于执行各种数学运算,例如线性代数、傅里叶变换、统计等
阅读全文