06 2023 档案
摘要:1. 算法构想 由于医院的数据涉及到隐私问题和防止个人信息泄露被恶意使用,那么就选择对其中的个人id也就是身份证号进行加密,选用单向加密算法,无法被解码,并且不需要密钥。但是由于一些理论上的漏洞会产生一些问题: 使用的数据加密可能会被暴力破解法进行破解掉,如何尽量减少穷举法能够破解掉的概率。 加密产
阅读全文
摘要:基于无监督深度学习的电子健康档案数据挖掘技术研究进展 摘要 介绍自编码器、生成式对抗网络、BERT等无监督深度学习方法,阐述其在电子健康档案数据挖掘领域中的应用及其挑战,指出无监督深度学习技术能够加速医疗知识发现和临床决策支持,促进个性化医学发展。 1. 引言 电子健康档案(Electronic H
阅读全文
摘要:深度学习在抗菌肽药物研究中的应用进展 摘要:抗菌肽(AMP)作为未来最有希望解决病原微生物耐药性的新型抗菌药物之一,其研发备受关注。抗菌肽一般较短,组成多样,迄今人们已发现数千条天然抗菌肽,并建立了多个公开的抗菌肽数据库,为新型抗菌肽的研发和设计奠定了基础。在抗菌肽的信息描述方面,人们使用了伪氨基酸
阅读全文
摘要:transformer--seq2seq transformer说白了就是一个sequence-to-sequence的模型,输入一个sequence,输出一个sequence,并且由机器自己决定要输出的长度是多少,比如语音辨识、机器翻译、语音翻译等任务,输出的sequence都是由机器自己决定。
阅读全文
摘要:self—attention 自注意力机制 一、输入 在学习自注意力机制之前,我们学到的神经网络的输入都是一个向量,输出可能是一个数值或者是一个类别。 1.举个例子。假设输入的向量是一排向量,而且输入的向量的数目是会改变的, 最简单的输入长度会改变的向量就是文字处理,假设我们的输入是一个句子的话。
阅读全文
摘要:强化学习 众所周知,机器学习也好深度学习也好,其解决的主要是四类问题: 分类问题 回归问题 聚类问题 降维问题 前两个是有标签的监督学习,后两个是没有标签的非监督学习,这也是数据挖掘领域常需要解决的四个问题。 强化学习是介于监督学习和非监督学习中的另一种学习方式,它可以理解为模拟大自然中生物进化的一
阅读全文
摘要:局部最小值于鞍点 训练模型的参数时,随着参数不断地更新,loss函数不会再继续下降,但是仍然对这个loss不满意 ,或者有时候发现一开始model就训练不起来,不论怎么更新参数loss函数都不会掉下去。我们认为在某个地方参数对loss的微分是0,于是梯度下降就失去了作用,这个时候训练就停止了,这个现
阅读全文
摘要:知识图谱的创造与充实 本节将讨论创建知识图谱的主要技术,并随后从从纯文本到结构化格式(以及二者之间的任何格式)的各种遗留数据源中丰富知识图谱。 创建知识图谱时要遵循的是适当方法取决于所涉及的参与者、领域、设想的应用程序、可用的数据源等。一般来说知识图谱的灵活性有助于从初始核心开始,可以根据需要从其他
阅读全文
摘要:情绪分析 Sentiment Analysis 情绪分析是对给定文本的极性进行分类的任务。例如,一条基于文本的推文可以被归类为 "正面"、"负面 "或 "中性"。鉴于文本和附带的标签,可以训练一个模型来预测正确的情绪。 情感分析技术可分为机器学习方法、基于词典的方法,甚至是混合方法。情感分析的一些细
阅读全文
摘要:基于文本挖掘和 SVM 的股票市场择时交易研究 1.关键词 量化投资: 上涨市: 下跌市: 震荡市: 空仓: 投资者情绪指数: 择时交易: 文本挖掘: 私募基金: 股票成交量: 百度指数: 多重共线性问题: Elastic Net变量选择方法: LASSO变量选择方法: Ridge回归: BIC度量
阅读全文