摘要: 一. 知识图谱和金融领域简述 什么是知识图谱? 借鉴其中一个理解: 知识图谱主要的目标是用来描述真实世界中间存在的各种实体和概念,以及它们之间的关联关系。 具体理论知识就不在此赘述,对于这个抽象的概念会有一篇文章来列举一个代表性的例子。 知识图谱起源于语义网络,最初由Google提出用与优化搜索结果 阅读全文
posted @ 2019-04-29 19:49 深度预习 阅读(7596) 评论(0) 推荐(0) 编辑
摘要: 主要两块,第一个是文件类型的转换,第二个是用docx包去对word文档中的table进行parse 1. 文件格式装换 因为很多各种各样的原因,至今还有一些word文档是doc的格式存的,对于这种,如果我们想用python对这个word文档中的内容进行解析的话,理论上必须要处理成docx先。 如果你 阅读全文
posted @ 2019-04-01 01:31 深度预习 阅读(2372) 评论(0) 推荐(0) 编辑
摘要: 1引言传统意义上讲,关系抽取是实体识别基础上的一个任务,其核心是抽取一个句子中包含实体对之间的关系。第一步就是训练一个关系抽取器,换句话讲就是训练一个关系分类器。因为模型不可能自己给关系起名字,所以我们需要人工的标注好语料,基于语料库我们一共有多少种关系。当模型训练好了之后,给它一个包含两个实体的句 阅读全文
posted @ 2019-03-25 00:07 深度预习 阅读(1364) 评论(0) 推荐(0) 编辑
摘要: 机器翻译领域常使用BLEU对翻译质量进行测试评测。我们可以先看wiki上对BLEU的定义。 BLEU (Bilingual Evaluation Understudy) is an algorithm for evaluating the quality of text which has been 阅读全文
posted @ 2019-03-18 19:47 深度预习 阅读(1237) 评论(0) 推荐(0) 编辑
摘要: 2-1、标量一个标量就是一个单独的数,一般用小写的的变量名称表示。 2-2、向量一个向量就是一列数,这些数是有序排列的。用过次序中的索引,我们可以确定每个单独的数。通常会赋予向量粗体的小写名称。当我们需要明确表示向量中的元素时,我们会将元素排列成一个方括号包围的纵柱: 我们可以把向量看作空间中的点, 阅读全文
posted @ 2019-03-03 21:13 深度预习 阅读(517) 评论(0) 推荐(0) 编辑
摘要: 本课程中所有作业将使用Python来完成。Python本身就是一种很棒的通用编程语言,现在在一些流行的库(numpy,scipy,matplotlib)的帮助下,它为科学计算提供强大的环境。 我们希望课程中的大部分人都有一些Python和numpy的经验;对于其他人来说,本教程将作为Python用于 阅读全文
posted @ 2019-02-11 14:01 深度预习 阅读(438) 评论(0) 推荐(0) 编辑
摘要: 从NLP的最基础开始吧。。不过自己看到这里,还没做总结,这里有一篇很不错的解析,可以分享一下。 N-gram语言模型 考虑一个语音识别系统,假设用户说了这么一句话:“I have a gun”,因为发音的相似,该语音识别系统发现如下几句话都是可能的候选:1、I have a gun. 2、I hav 阅读全文
posted @ 2019-02-11 12:51 深度预习 阅读(416) 评论(1) 推荐(0) 编辑
摘要: 分词(Segment):中英文都存在分词的问题,不过相对来说,英文单词与单词之间本来就有空格进行分割,所以处理起来相对方便。但是中文书写是没有分隔符的,所以分词的问题就比较突出。分词常用的手段可以是基于字典的最长串匹配,据说可以解决85%的问题,但是歧义分词很难。另外就是当下主流的统计机器学习的办法 阅读全文
posted @ 2019-02-11 11:54 深度预习 阅读(619) 评论(0) 推荐(0) 编辑
摘要: 建议1、理解Pythonic概念—-详见Python中的《Python之禅》 建议2、编写Pythonic代码 (1)避免不规范代码,比如只用大小写区分变量、使用容易混淆的变量名、害怕过长变量名等。有时候长的变量名会使代码更加具有可读性。 (2)深入学习Python相关知识,比如语言特性、库特性等, 阅读全文
posted @ 2019-01-01 10:31 深度预习 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 介绍: 推荐系统中最为主流与经典的技术之一是协同过滤技术(Collaborative Filtering),它是基于这样的假设:用户如果在过去对某些项目产生过兴趣,那么将来他很可能依然对其保持热忱。其中协同过滤技术又可根据是否采用了机器学习思想建模的不同划分为基于内存的协同过滤(Memory-bas 阅读全文
posted @ 2018-12-24 00:07 深度预习 阅读(3883) 评论(0) 推荐(0) 编辑