08 2023 档案
摘要:001、情形1 >>> dict1 = {} >>> list1 = [dict1.fromkeys(("A", "B", "C"), 0)] * 3 ## 生成列表,元素为字典 >>> list1 [{'A': 0, 'B': 0, 'C': 0}, {'A': 0, 'B': 0, 'C': 0
阅读全文
摘要:001、 [root@pc1 test02]# ls a.fa test.py [root@pc1 test02]# cat a.fa ## 测试fasta >Rosalind_1 ATCCAGCT >Rosalind_2 GGGCAACT >Rosalind_3 ATGGATCT >Rosalin
阅读全文
摘要:给定两个字符串str1和str2,返回字符串str2在str1中的所有的位置索引。 001、 直接实现 [root@pc1 test01]# ls test.py [root@pc1 test01]# cat test.py ## 程序 #!/usr/bin/env python # -*- cod
阅读全文
摘要:假定显性纯合子、杂合子、隐性纯合子的个数分别为k、m、n个,则随机收取两个个体,后代为显性性状的概率。 001、直接实现 [root@pc1 test01]# ls test.py [root@pc1 test01]# cat test.py ## 计算程序 #!/usr/bin/env pytho
阅读全文
摘要:001、configure: error: libcurl library not found 002、解决方法 [root@pc1 test01]# yum -y install libcurl-devel 。
阅读全文
摘要:001、configure: error: liblzma development files not found 002、解决方法 [root@pc1 test01]# yum -y install xz-devel 。
阅读全文
摘要:001、configure: error: libbzip2 development files not found 002、解决方法 [root@pc1 test01]# yum -y install bzip2-devel 。
阅读全文
摘要:001、configure: error: zlib development files not found 002、解决方法: [root@pc1 test01]# yum -y install zlib-devel 。
阅读全文
摘要:001、系统信息、问题 [root@pc1 software]# cat /etc/redhat-release ## 系统信息 CentOS Linux release 7.6.1810 (Core) [root@pc1 software]# pip install pysam # bash: p
阅读全文
摘要:兔子一代生3对,然后每隔一代兔子才有繁殖能力,问最初有1对兔子,问5代后一共有多少只兔子? 001、直接实现 >>> list1 = [1] * 5 >>> list1 [1, 1, 1, 1, 1] >>> for i in range(2,5): ... list1[i] = list1[i -
阅读全文
摘要:001、对G、C计数进行统计 [root@pc1 test01]# ls a.fa test.py [root@pc1 test01]# cat a.fa ## 测试DNA序列 >Rosalind_6404 CCTGCGGAAGATCGGCACTAGAATAGCCAGAACCGTTTCTCTGAGG
阅读全文
摘要:001、依据字典的值对字典进行排序 a、正向排序 >>> dict1 = {"c":30, "a":40, "b":80, "d":20, "e":60} ## 测试字典 >>> dict1 {'c': 30, 'a': 40, 'b': 80, 'd': 20, 'e': 60} >>> sort
阅读全文
摘要:001、依据字典的键进行排序 a、正向排序 >>> dict1 = {"c":30, "a":40, "b":80, "d":20, "e":60} >>> dict1 {'c': 30, 'a': 40, 'b': 80, 'd': 20, 'e': 60} >>> for i in sorted
阅读全文
摘要:001、 输出键最大的项 a、 >>> dict1 = {"c":30, "a":40, "b":80, "d":20, "e":60} >>> dict1 {'c': 30, 'a': 40, 'b': 80, 'd': 20, 'e': 60} >>> max_key = max(dict1.k
阅读全文
摘要:001、输出值最大的项 a、 >>> dict1 = {"c":30, "a":40, "b":80, "d":60} ## 测试字典 >>> dict1 {'c': 30, 'a': 40, 'b': 80, 'd': 60} >>> max_value = max(dict1.values())
阅读全文
摘要:001、直接比较计算 [root@PC1 test01]# ls a.fa b.fa test.py [root@PC1 test01]# cat a.fa ## 测试dna序列 GAGCCTACTAACGGGAT [root@PC1 test01]# cat b.fa ## 测试dna序列 CAT
阅读全文
摘要:001、 来源: https://zhuanlan.zhihu.com/p/491676471
阅读全文
摘要:001、 利用循环结构实现 [root@PC1 test01]# ls a.fa test.py [root@PC1 test01]# cat a.fa ## 测试DNA序列 AAAACCCGGT [root@PC1 test01]# cat test.py ## 程序 #!/usr/bin/env
阅读全文
摘要:001、利用切片实现 >>> str1 = "abcdef" ## 测试字符串 >>> str1[::-1] 'fedcba' 002、利用for 循环实现 >>> str1 = "abcdef" ## 测试字符串 >>> rev = "" >>> for i in str1: ## 循环结构实现反
阅读全文
摘要:001、 利用循环结构实现 [root@PC1 test01]# ls a.fa test.py [root@PC1 test01]# cat a.fa ## 测试RNA序列 AUGGCCAUGGCGCCCAGAACUGAGAUCAAUAGUACCCGUAUUAACGGGUGA [root@PC1
阅读全文
摘要:001、利用循环结构 [root@PC1 test01]# ls a.fa test.py [root@PC1 test01]# cat a.fa ## 测试DNA序列 GATGGAACTTGACTACGTAAATT [root@PC1 test01]# cat test.py ## 转换程序 #!
阅读全文
摘要:001、测试序列,碱基序列保存只a.fa文件中,统计下面这段序列中A、C、G、T碱基的个数 [root@PC1 test01]# ls a.fa [root@PC1 test01]# cat a.fa ## 测试fasta文件 AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTC
阅读全文
摘要:QTL: 是数量性状基因座: 它指的是控制数量性状的基因在基因组中的位置。 QTL实际上是一个抽象的概念。 指的是存在与基因组中的某一位置,这个位置上的基因会影响某一数量性状的表达。 QTL可以是一个简单的基因座,也可以是多个基因座的组合。
阅读全文
摘要:001、加载R包 library(tidyverse) library(ggplot2) library(viridis) 02、生成基本图形 plot1 <- ggplot(data = mpg, aes(x = displ, y = hwy, color = class)) + geom_poi
阅读全文
摘要:001、问题 002、解决方法 library(tidyverse) head(mpg) 。
阅读全文
摘要:001、 C语言的编译链接过程要把我们编写的一个c程序(源代码)转换成可以在硬件上运行的程序(可执行代码),需要进行编译和链接。 002、 编译就是把文本形式源代码翻译为机器语言形式的目标文件的过程。链接是把目标文件、操作系统的启动代码和用到的库文件进行组织形成最终生成可执行代码的过程 003、编译
阅读全文
摘要:c语言标准: 随着C语言在多个领域的推广、应用,一些新的特性不断被各种编译器实现并添加进来。于是,建立一个新的“无歧义、与具体平台无关的C 语言定义”成为越来越重要的事情。 作为软件行业中的老大哥级人物。C 语言也有自己的标准,而且是国际标准。 如果大家遵循同一个标准,那么就会避免分歧的产生,避免出
阅读全文
摘要:001、 [root@PC1 test02]# ls a.txt b.txt [root@PC1 test02]# cat a.txt ## 测试数据 77 jj jj ee ww [root@PC1 test02]# cat b.txt ## 测试数据 xx rr ee 88 ww [root@P
阅读全文
摘要:001、 [root@PC1 test02]# ls a.txt b.txt [root@PC1 test02]# cat a.txt ## 测试文件 88 77 jj ff yy rr tt [root@PC1 test02]# cat b.txt ## 测试文件 uu rr tt uu 77 8
阅读全文
摘要:001、for循环 [root@PC1 test02]# ls a.txt [root@PC1 test02]# cat a.txt ## 测试数据 1 2 3 4 5 6 7 8 9 10 11 12 [root@PC1 test02]# awk '{sum = 0; for(i = 1; i <
阅读全文
摘要:001、FIELDWIDTHS 用于指定输出字段的宽度 [root@PC1 test02]# ls a.txt [root@PC1 test02]# cat a.txt ## 测试数据 abcdefghijklmnopqrstuvwxyz ABCDEFGHIJKLMNOPQRSTUVWXYZ [ro
阅读全文
摘要:001、NR [root@PC1 test02]# cat a.txt ## 测试文件 1 2 3 4 5 [root@PC1 test02]# cat b.txt ## 测试文件 11 12 13 14 15 [root@PC1 test02]# awk '{print NR, $0}' a.tx
阅读全文
摘要:品种间的选择是一次性的行为,而品种内的选择却是长期的工作。只有真正做好了选择工作,才能保证持续的遗传进展。品种内选择(即育种)的具体方法有很多,这里只做概括性的论述。 一般来说,育种的过程就是选择优良基因的过程,过去我们只通过外表来判断基因,甚至通过肉眼就作出了评估,肉眼判断是很主观的判断,可靠性很
阅读全文
摘要:001、 %d:整数 %i:十进制整数 %.nf:浮点数 %s:字符串 举例: >>> print("aaaa %d bbbb" % 10) ## 整数 aaaa 10 bbbb >>> print("aaaa %i bbbb" % 10) ## 十进制整数 aaaa 10 bbbb >>> pri
阅读全文
摘要:001、分别输出染色体ID、序列和序列的长度 [root@PC1 test02]# ls a.fa test.py [root@PC1 test02]# cat a.fa ## 测试数据 >seq1 AGAAGGGG >seq2 AAACCTTTT >seq3 AAATTTCCGG [root@PC
阅读全文
摘要:通过基因组间的比较分析, 鉴定了大量的大片段结构变异, 包括723 862个存在/缺失变异(presence/absence variants, PAVs)、27 531个拷贝数目变异(copy number variants, CNVs)、21 886个易位事件(translocation eve
阅读全文
摘要:001、 在种质资源的群体变异与性状挖掘研究中, 通常需要借助1个参考基因组, 通过将重测序数据比对到参考基因上来鉴定个体间的遗传变异(Huang et al.,2012)。这种变异鉴定的方法受制于参考基因组序列及其与检测个体间的相似性, 参考基因组缺失的基因组信息以及与比对个体差异较大区域的信息将
阅读全文
摘要:001、 。 reference 祝光涛,黄三文.360度群体遗传变异扫描——大豆泛基因组研究[J].[2023-08-16].DOI:10.11983/CBB20096.
阅读全文
摘要:001、 注: 01、Pacific Bio-sciences (PacBio)和Oxford Nanopore):长 片 段 单 分 子 测 序 技 术 02、BioNano genome mapping:辅助组装技术 03、High-throughput chromosome conformat
阅读全文
摘要:001、线性泛基因组 仅仅包含序列信息,源于不同个体的变异信息被丢失。 迭代组装、map-to-pan、个体de novo组装的泛基因组均是线性泛基因组。 002、图形泛基因组 图结构泛基因组是一个二维序列图谱,它以参考基因组为框架,以单个碱基作为图的节点,碱基间的前后关系作为图的边,存在序列差异的
阅读全文
摘要:判定基因组为开放泛基因组和闭合泛基因组的依据: 根据泛基因组中核心基因组的比例,将泛基因组分为开放型和闭合型两种。 基于泛基因组大小随测序样本数目的变化趋势, 泛基因组可分为闭合型和开放型两类。 开放型泛基因组和闭合型泛基因组的根本区别在于增加样本数目后,泛基因组的大小是否会持续的增加。 001、
阅读全文
摘要:001、基本概念 Tettelin 等 在2005 首次在细菌的研究中提出泛 基因组(pan-genome)的概念,指整个物种基因组序列的非冗余集合,其中包括存在于该物种几乎所有个体中的核心基因组(core genome)和仅在部分个体中存在的可变基因组(accessory/variable/dis
阅读全文
摘要:001、基本分类 01、为什么核心基因不是100%? 核心基因从概念上讲是所有个体中都存在的基因,但是实际的测序过程中难以保证所有个体的每个DNA片段都有很好的测序质量, 为了避免这种少部分个体部分片段未测出,遗漏核心基因的统计和分类,使用一个比例范围更可取。 02、为什么要有cloud 这个分类?
阅读全文
摘要:001、 https://www.bilibili.com/video/BV1fF411879A/?vd_source=9f2c87b6a7fd328f19dccf7b7b1f8c1a
阅读全文
摘要:输出is和not后面的单词 001、 [root@PC1 test01]# ls a.txt [root@PC1 test01]# cat a.txt ## 测试数据 this is wang ,not wan that is chen, not che this is chen ,and wang
阅读全文
摘要:以ntpd服务为例 001、查看ntpd服务的的当前状态 [root@PC1 home]# systemctl list-unit-files | grep "ntpd" ## 查看ntpd服务 ntpd.service disabled ntpdate.service disabled 002、设
阅读全文
摘要:001、查看ntp服务状态 [root@PC1 home]# cat /etc/redhat-release ## 系统版本 CentOS Linux release 7.6.1810 (Core) 002、启动ntp服务 [root@PC1 home]# systemctl start ntpd
阅读全文
摘要:001、整体分类 002、各自特征 01、迭代组装; 个体测序数据和参考基因组比对,提取未比对到参考基因组的序列,组装为contig,和参考基因组合并构成泛基因组。(依赖参考基因组) 02、map-to-pan; 个体测序数据组装成contig,然后和参考基因组比对,提取未比对到参考基因组的序列,
阅读全文
摘要:001、-D选项用于限定只删除模式空间中的第一行 [root@PC1 test01]# ls data.txt [root@PC1 test01]# cat data.txt ## 测试数据 Header Line First Data Line End of Data Lines ## N选项将匹
阅读全文
摘要:001、-n(next),处理匹配行的下一行 [root@PC1 test01]# ls a.txt [root@PC1 test01]# cat a.txt ## 测试数据 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 [root@PC1 test01]
阅读全文