摘要: 词性标注器 CC 并列连词 RB 副词 IN 连词 JJ 形容词 帮助文档使用 nltk.help.upenn_tagset( 'RB*') text = nltk.Text(word.lower() for word in nltk.corpus.brown.words()) text.simil 阅读全文
posted @ 2016-10-18 17:08 小_龟 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 功能 1):分词 jieba.cut方法接受两个输入参数: 1) 第一个参数为需要分词的字符串 2)cut_all参数用来控制是否采用全模式 jieba.cut_for_search方法接受一个参数:需要分词的字符串,该方法适合用于搜索引擎构建倒排索引的分词,粒度比较细 注意:待分词的字符串可以是g 阅读全文
posted @ 2016-10-18 17:07 小_龟 阅读(235) 评论(0) 推荐(0) 编辑
摘要: rabbitmq消息队列 server端 1 #!/usr/bin/env python 2 import pika 3 4 connection = pika.BlockingConnection(pika.ConnectionParameters( 5 'localhost')) 6 chann 阅读全文
posted @ 2016-10-18 06:50 小_龟 阅读(233) 评论(0) 推荐(0) 编辑