随笔分类 -  自然语言处理

摘要:词语相似性比较,最容易想到的就是编辑距离,也叫做Levenshtein Distance算法。在Python中是有现成的模块可以帮助做这个的,不过代码也很简单,我这边就用scala实现了一版。 编辑距离 编辑距离是指一个字符串改编成另一个字符串的最短距离,它描述了两个字符串的相近程度。比如: 因此所 阅读全文
posted @ 2017-12-12 17:38 xingoo 阅读(2685) 评论(0) 推荐(2) 编辑
摘要:最近开始研究自然语言处理了,所以准备好好学习一下,就跟着《Python自然语言处理》这本书,边学边整理吧 安装 Mac里面自带了python2.7,所以直接安装nltk就可以了。 默认执行 会报错: 这是因为系统内部已经有six包了,不能被修改。所以可以跳过six,直接安装nltk 这样可以看到输出 阅读全文
posted @ 2017-09-21 18:05 xingoo 阅读(1423) 评论(0) 推荐(0) 编辑
摘要:整理到第四天越来越心虚了,因为发现好多专业的技术都不知道,比如关于语义的分析提取之类的,后面打算专门针对这些专业性的“玩法”整理下。那么今天,就继续整理下人机问答的原理实现吧! 更多内容参考: "自然语言处理扫盲·第一天——自然语言处理的背景、应用、推荐资料" "自然语言处理扫盲·第二天——白话机器 阅读全文
posted @ 2017-09-09 10:41 xingoo 阅读(4587) 评论(0) 推荐(7) 编辑
摘要:前面了解过机器翻译的一些内容,对于文本的信息挖掘应该有了一定的了解,今天再来扫盲一下情感分析吧~ 更多内容参考: "自然语言处理扫盲·第一天——自然语言处理的背景、应用、推荐资料" "自然语言处理扫盲·第二天——白话机器翻译原理" 引言 情感分析在很多点上领域有很多的应用场景: 比如,酒店网站需要提 阅读全文
posted @ 2017-09-07 18:13 xingoo 阅读(10147) 评论(10) 推荐(5) 编辑
摘要:由于最近要做一些自然语言处理的分享,但是我又不是科班出身,所以只能临时抱佛脚的学习以下基本的原理。但是由于底子很薄,所以只能凭借google和baidu有限的资料进行总结。这里不会看到太复杂的公式,因为公式层面我也理解不了....就当做是从0学习自然语言处理的过程的记录吧! 更多内容参考: "自然语 阅读全文
posted @ 2017-09-06 19:46 xingoo 阅读(11245) 评论(4) 推荐(4) 编辑

点击右上角即可分享
微信分享提示