摘要:
生物信息学 染色体可以据染色图谱判断染色体号码,1-22号染色体依次变短,它们影响机体发育,23号染色体决定性别。肿瘤是由于遗传密码变异造成的。因此,遗传密码的解读非常重要,但是因为遗传密码长度非常长,所以虽然已经全部测出来,但是破译它们依然存在很多难题。 生物信息学是一个学科领域,它的研究对象基因 阅读全文
摘要:
信息检索: 数据库 Web of science 影响因子只是针对期刊打分,并不是对文章打分。所以对文章评价可以看引用次数。 SCIE (Science Citation Index Expanded), 顾名思义为SCI索引的扩张版本。然而两者的期刊评选和期刊收录皆采用一致的标准,两者的主要不同在 阅读全文
摘要:
信息检索: 信息检索原理是,将书写不规范的原始数据先存储,再通过归纳化or标准化手段进行拆分,便于用户搜索。 信息检索类型可依据数据内容进行分类,文献检索是通过输入关键字进入搜索引擎,搜索仅找到含有关键字符的文字,最后选择哪些文献由学者本身确定。数据检索是在相应数据库中直接找到准确数据,该检索的结果 阅读全文
摘要:
应用统计学 数据的概括性度量 集中趋势 Mode众数是唯一描述无序类别数据,由图可知众数便是图形中的峰。 对于类别变量,众数就是某一种类别。 中位数和平均数都可能不是样本中的值。 中位数不受极值影响,对于类别数据来说,中位数是某一类别(同mode),各变量值与中位数的离差绝对值之和最小,与均数不同。 阅读全文
摘要:
阅读全文
摘要:
多变量数据 雷达图radar chart 如上图可知,雷达图的缺点是看不清,此时可采用线性变换(相差小)or对数变换(相差大)的方法使得图像展开。 但是第一幅图用于比价种类比较鲜明,而第二幅图虽然比较个体很清楚却不能比较种类,所以图像服务于研究的问题。 同样的,对于不同坐标变量的选择使得图形有不同, 阅读全文
摘要:
生命组学: 细菌和其他物种比,容易发生基因漂移,duplication和重排。 泛基因组学研究的一般思路是通过comparison找到特殊基因区域orspecific gene,研究其调控机制(即通过一维发现特殊三维结构,再利用一维结构解释特殊结构的形成机制eg:基因保守与保守空间结构vs非保守空间 阅读全文
摘要:
生物医疗大数据 存在系统误差使得估计量有偏,如下图红色和蓝色图形,存在随机误差使得估计量并不是同一个值,如图中除去期望之外的曲线值,为了控制随机抽样造成的误差,可以使用p-value决定是否服从假设检验,判断两个变量之间相关性的有无。 相关系数:该系数广泛用于度量两个变量之间的线性相关程度。 建立模 阅读全文