摘要: # -*- coding=utf-8 -*-import sys, re, codecsimport cProfilefrom yaha import Cuttor, RegexCutting, SurnameCutting, SurnameCutting2, SuffixCuttingfrom y 阅读全文
posted @ 2016-03-26 09:48 qqhfeng16 阅读(532) 评论(0) 推荐(0) 编辑
摘要: 可定制的分词库——Yaha(哑哈)分词在线测试地址:http://yaha.v-find.com/ 部署于GAE yahademo.appspot.comYaha分词主要特点是把分词过程分成了4个阶段,每个阶段都可以让用户加入自己的一些定制,以面向不同的用户需求。 这是一个最简单真白的示例:# -* 阅读全文
posted @ 2016-03-26 09:47 qqhfeng16 阅读(982) 评论(0) 推荐(0) 编辑
摘要: 件过滤: Python 中文分词库 Yaha "哑哈"中文分词,更快或更准确,由你来定义。通过简单定制,让分词模块更适用于你的需求。 "Yaha" You can custom your Chinese Word Segmentation efficiently by using Yaha 基本功能 阅读全文
posted @ 2016-03-26 09:06 qqhfeng16 阅读(8471) 评论(0) 推荐(1) 编辑
摘要: 【机器学习实验】使用朴素贝叶斯进行文本的分类 【机器学习实验】使用朴素贝叶斯进行文本的分类 时间:2015-05-03 23:41:39 阅读:2251 评论:0 收藏:0 [点我收藏+] 标签:机器学习实验 引言 朴素贝叶斯由贝叶斯定理延伸而来的简单而强大的概率模型,它根据每个特征的概率确定一个对 阅读全文
posted @ 2016-03-26 09:00 qqhfeng16 阅读(2956) 评论(0) 推荐(0) 编辑