黄聪

论SEO对人类的重要性,请看我的博客:hcsem.com

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

随笔分类 -  NLTK

摘要:本文演示使用NLTK让计算机学习如何通过名字识别性别。1、导入NLTK:import nltkfrom nltk.book import *2、定义学习方法def gender_features(word): return {'last_letter':word[-1]}3、导入学习的姓名-性别名单:from nltk.corpus import namesimport randomnames=([(name,'male') for name in names.words('male.txt')] + [(name,'female' 阅读全文
posted @ 2011-08-29 18:30 黄聪 阅读(6525) 评论(0) 推荐(0) 编辑

摘要:一、similar用来识别文章中和搜索词相似的词语,可以用在搜索引擎中的相关度识别功能中。text1.similar("monstrous")查询出了text1中与monstrous相关的所有词语:二、common_contexts用来识别2个关键词相似的词语。text2.common_contexts(["monstrous","very"])三、generate用来自动生成文章。text3.generate()四、len可以用于判断重复词密度from __future__ import divisionlen(text3) / l 阅读全文
posted @ 2011-08-29 12:29 黄聪 阅读(17973) 评论(4) 推荐(0) 编辑

摘要:最近开始学习Python+NLTK自然语言处理,在此分享自己的学习经验,因为是初学,肯定有很多很多不懂的地方,发布此文章绝非为了显示自己的水平,而是因为网络上对NLTK的资料实在太少了,我就想分享一下自己的心得,也希望能够得到更多高手的指点,希望高手们发现不对的地方耐心指点,切勿针锋相对,这样会打击小弟的学习动力的,呵呵~好了,开始吧。一、到NLTK的官网下载Python2.66(虽然Python已经到3.0了,但是2.x的比较稳定,兼容2.x的软件也比较多一些)、PyYAML和NLTK。下载地址:http://www.nltk.org/download二、讲这些都安装好,然后运行Python 阅读全文
posted @ 2011-08-29 11:19 黄聪 阅读(59822) 评论(13) 推荐(9) 编辑