NLP概览(一)

NLP是什么?有哪些应用

NLP即自然语言处理。
主要应用在语音识别、分词、词性标注、关键词提取、概要、句法分析、语义理解与提取、机器翻译、印刷体或手写体识别、拼写错误、汉字输入、文献查询

为什么要分词——词是语义的基本单位

罗马拼音系语言的字词之间天生具有空格,所以分词大多用于象形文件上面,随着欧洲的扩张,使用罗马拼音系的国家非常多,而象形文字,用得最多的无疑是中国了。

中文体现语义的最小单位是词,比如上面的“罗马”,如果你将其分成“罗”“马”,那就失了原意,当然有的字本身就单独成词,如“我爱你”拆分成“我”“爱”“你”是没有什么问题的。


因为词是表达语义的基本单位,所以我们要理解一句话的意思,首先就要经过分词。大家可以找一篇古文来看看,加深一下体会。

 

转载请注明出处 http://www.cnblogs.com/hx78/ 

 

posted @ 2017-08-07 12:51  hx78  阅读(452)  评论(0编辑  收藏  举报