黑逍逍 - 博客园

2023年10月8日

摘要：什么是词性标注自然语言处理（NLP）中的词性标注（Part-of-Speech Tagging，简称POS Tagging）是文本处理的一项重要任务，其目标是为给定的文本中的每个单词或标记分配一个词性标签，表示该单词在句子中的语法角色和词性类别。这些标签通常用于分析文本的语法结构和语义含义，有助于阅读全文

posted @ 2023-10-08 20:45 黑逍逍阅读(611) 评论(0) 推荐(0)

文本分类入门

摘要：文本分类是自然语言处理（NLP）领域中的一项任务，它涉及将文本文档分配到一个或多个预定义的类别或标签中。其主要目标是使用计算机算法来自动识别和归纳文本的内容，以便更好地组织、检索和理解大量的文本数据。文本分类在许多应用中都有广泛的用途，包括：情感分析：将文本分为积极、消极或中性情感，以了解人们对阅读全文

posted @ 2023-10-08 20:23 黑逍逍阅读(234) 评论(0) 推荐(0)

NLP是什么

摘要： NLP代表自然语言处理（Natural Language Processing），是人工智能（AI）的一个子领域，专注于计算机与人类语言之间的交互。NLP的目标是使计算机能够以有意义和有用的方式理解、解释和生成人类语言。该领域涵盖了广泛的任务和应用，包括：文本分类文本分类是自然语言处理（NLP）阅读全文

posted @ 2023-10-08 16:21 黑逍逍阅读(576) 评论(0) 推荐(0)

GAN（生成对抗网络，Generative Adversarial Network）

摘要：生成对抗网络（GAN）是一种深度学习模型架构，由生成器（Generator）和判别器（Discriminator）两个神经网络组成。这两个网络之间进行博弈式训练。生成器（Generator）：生成器是一个神经网络模型，它接收一个随机噪声向量作为输入，并试图生成与训练数据相似的新数据样本。生成器的目阅读全文

posted @ 2023-10-08 13:54 黑逍逍阅读(561) 评论(0) 推荐(0)

2023年9月24日

表达组都包括什么

摘要：表达组（expression profile）是指在一个生物体或细胞中的所有基因在特定时间和条件下的表达情况的总和。表达组研究的主要目标是了解基因的表达模式，特别是哪些基因在不同条件下的表达水平发生了变化。其实就是mRNA分子被细胞中的核糖体（ribosome）解读，根据mRNA上的核酸序列合成蛋阅读全文

posted @ 2023-09-24 00:19 黑逍逍阅读(86) 评论(0) 推荐(0)

转录组都有什么

摘要：转录组是指一个生物体内的所有转录本（RNA分子），也就是所有基因在特定时间和条件下的表达情况。转录组研究的目的是了解在特定生物样本中哪些基因被转录成RNA，以及它们的相对表达水平。一个典型的转录组研究通常包括以下方面的内容： RNA提取：从生物样本（通常是细胞或组织样本）中提取总RNA。总RNA 阅读全文

posted @ 2023-09-24 00:01 黑逍逍阅读(427) 评论(0) 推荐(0)

2023年9月19日

DataFrame创建

摘要： DataFrame是一个二维标签数据结构，有行和列可以看作是一个excel表格创建： 1，横向创建这种就是字典的方式什么时候需要这种呢？需要字典进行映射，然后要将结果转excel。那就需要这种方式 2，列向创建这种就是列表的方式阅读全文

posted @ 2023-09-19 02:07 黑逍逍阅读(42) 评论(0) 推荐(0)

数据清洗

摘要：缺失值判断各个单元格是否为空。 isnull() 判断各个单元格是否为空删除包含缺失值的行 df.dropna(inplace=True) 填充缺失值 # 填充缺失值为指定值，例如0 df.fillna(0, inplace=True) # 或者填充缺失值为列的均值 df.fillna(df.m 阅读全文

posted @ 2023-09-19 02:02 黑逍逍阅读(114) 评论(0) 推荐(0)

监督学习-分类算法-KNN

摘要：定义：KNN最核心的功能“分类”是通过多数表决来完成的，具体方法是在待分类点的K个最近邻中查看哪个类别占比最多。哪个类别多，待分类点就属于哪个类别如果选择K=3，那么模型将考虑目标数据点的3个最近邻居，对于图像的分类。他的邻居是什么每个图像样本通常会被表示为一个特征向量，其中每个特征可以代表图阅读全文

posted @ 2023-09-19 01:47 黑逍逍阅读(32) 评论(0) 推荐(0)

非监督学习-聚类算法-Kmeans

摘要： K均值聚类算法是一种用于将数据集中的数据点分成不同组的方法。这些组通常称为簇。这个算法的核心思想是把相似的数据点放在同一个簇中，从而把数据分成几个组，每个组内的数据点彼此相似。这是一个简单的K均值聚类过程：选择簇的数量(K)：首先，将数据分成k个簇。随机选择K个点作为初始簇中心：从数据集中随机阅读全文

posted @ 2023-09-19 01:34 黑逍逍阅读(96) 评论(0) 推荐(0)

公告