摘要: "1. pyhanlp介绍和简单应用" "2. 观点提取和聚类代码详解" 1. 前言 本文介绍如何在无监督的情况下,对文本进行简单的观点提取和聚类。 2. 观点提取 观点提取是通过依存关系的方式,根据固定的依存结构,从原文本中提取重要的结构,代表整句的主要意思。 我认为比较重要的依存关系结构是"动补 阅读全文
posted @ 2019-01-16 20:35 hyc339408769 阅读(5442) 评论(1) 推荐(2) 编辑
摘要: "1. pyhanlp介绍和简单应用" "2. 观点提取和聚类代码详解" 1. 前言 中文分词≠自然语言处理! 中文分词只是第一步;HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的API。 不同于一些简陋的分词类库,HanLP精心优化了内部数据结构和I 阅读全文
posted @ 2019-01-16 20:33 hyc339408769 阅读(9728) 评论(0) 推荐(1) 编辑
摘要: 1. 前言 我们之前有介绍过 "4. EM算法 高斯混合模型GMM详细代码实现" ,在那片博文里面把GMM说涉及到的过程,可能会遇到的问题,基本讲了。今天我们升级下,主要一起解析下EM算法中GMM(搞事混合模型)带惩罚项的详细代码实现。 2. 原理 由于我们的极大似然公式加上了惩罚项,所以整个推算的 阅读全文
posted @ 2019-01-16 20:32 hyc339408769 阅读(2269) 评论(0) 推荐(0) 编辑
摘要: "1. EM算法 数学基础" "2. EM算法 原理详解" "3. EM算法 高斯混合模型GMM" "4. EM算法 GMM代码实现" "5. EM算法 高斯混合模型+Lasso" 1. 前言 前面几篇博文对EM算法和GMM模型进行了介绍,本文我们通过对GMM增加一个惩罚项。 2. 不带惩罚项的GM 阅读全文
posted @ 2019-01-16 08:31 hyc339408769 阅读(3163) 评论(0) 推荐(1) 编辑