摘要:
数据分析¶ 构建模型,我们首先要对数据进行充分的分析,通过可视化与表格的形式展现我们能够更加有效的将其用在模型中。 In [1]: import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import war 阅读全文
摘要:
解读baseline 1、为什么要self.ngram = ngram,而不是直接赋值 定义实例属性使得类(class)的其他方法(其他def)可以直接访问和使用 ngram 的值。例如,tokenize 方法需要使用 ngram 的值来执行分词操作,如果不将其定义为实例属性,就无法在 tokeni 阅读全文
摘要:
基本背景 目的 RNAi是生物体内天然存在的一种基因表达调控机制,通过抑制靶基因的表达来实现降低目标蛋白量的目的,这一机制一般可通过siRNA实现。本研究期望聚焦于通过机器学习技术,利用化学修饰后的siRNA序列来预测RNA干扰(RNAi)机制下对靶基因(target gene)的沉默效率,这一指标 阅读全文
摘要:
Transformer:这个模型架构就是摒弃了所有的循环结构,完全依赖于注意力机制对源语言序列和目标语言序列全局依赖的建模 对于循环神经网络来说,上下文的语义依赖是通过维护循环单元中的隐状态实现的。在编码过程中,每一个时间步的输入建模都涉及到对隐藏状态的修改。随着序列长度的增加,编码在隐藏状态中的序 阅读全文
摘要:
Baseline代码相关解读 是否需要使用self判定的标准是是否在类中 在 Python 中,self 是一个类的实例方法中的参数,用于指代调用该方法的实例本身。在代码示例中,self 并不是必需的,因为这个示例代码不是类的一部分,只是一个独立的函数调用。让我们逐步解释这些区别。 类中的方法与独立 阅读全文
摘要:
Deepfake Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频 深度伪造技术(Deepfake)主要可以分为以下几个研究方向: 面部交换:专注于在两个人的图像之间执行身份交换。 面部重演:强调转移源运动和姿态。 说话面部生成:专注于在角色生成中实现口型与文本内容的自然匹配。 阅读全文
摘要:
WGBS的分析全流程: 主要参考资料: WGBS甲基化分析 Bismark软件使用入门 沉浸式体验WGBS(上游) 甲基化流程浅析 听说你不会处理WGBS数据?安排上 全基因组甲基化分析简述:使用BS-Seeker2 Bismark Bisulfite Mapper学习笔记(二)甲基化信息提取以及文 阅读全文
摘要:
下载数据 基础知识 首先了解一下SRA数据库的架构: SRP(项目 Project)—>SRS(样本 Sample)—>SRX(数据产生 Experiment)—>SRR(数据本身) 国际上的三大生物数据库:SRA, ENA or DDBJ,分别在美国、欧洲、日本,它们之间的数据是同步的,所以可以在 阅读全文
摘要:
参考博客 https://zhuanlan.zhihu.com/p/377600056 https://www.jianshu.com/p/96688fecd864 https://zhuanlan.zhihu.com/p/676395563 查看质控 # 使用fastqc查看质控结果 fastqc 阅读全文
摘要:
参考博客 https://mp.weixin.qq.com/s/uwO9G_71h8kU3lTWsW_zPw https://www.jianshu.com/p/1a23656a0713 https://zhuanlan.zhihu.com/p/520071927 数据质控 fastqc -o 0_ 阅读全文