摘要:
学习的两个分支:基于符号主义的专家系统(使用规则),基于连接主义的概率统计的系统(如机器学习,深度学习) 使用哪种系统主要看数据量,没有数据或者数据量很少的时候使用专家系统,有大量数据的时候使用机器学习或者深度学习 专家系统=推理引擎+知识 专家系统的流程: 任务:搭建金融知识图谱 1、金融领域或者 阅读全文
摘要:
1、准确率:预测正确的样本总样本 2、精确率和召回率 CorrectNot correct Selected TP FP Not selected FN TN ——来源于贪心科技NLP班讲解 阅读全文
摘要:
简介 分词是NLP的基本功能之一,现在发展比较成熟了,目前比较热门的分词工具有jieba,snownlp,pkuseg等等。分词工具的使用是比较简单的,具体查询相应的github项目即可,上面有比较好的示例。本文我们主要讲解一下分词的相关算法:前向最大匹配,后向最大匹配,语言模型,维特比算法等。现分 阅读全文
摘要:
一、文本表示 文本表示:one-hot(单词),boolean representation(句子),count-based representation(句子) 词典:[我,要,去,北京,上海,南京] One-hot:向量空间只有一个维度是1,其余都是0(缺点:高维度高稀疏) w1=我:[1,0, 阅读全文