会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
老顽童2007
广度是深度的副产品
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
下一页
2016年12月14日
结巴分词5--关键词抽取
摘要: 作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明。谢谢! 1 简介 关键词抽取就是从文本里面把跟这篇文档意义最相关的一些词抽取出来。这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语。
阅读全文
posted @ 2016-12-14 07:49 老顽童2007
阅读(31818)
评论(0)
推荐(5)
编辑
2016年12月12日
结巴分词4--词性标注
摘要: 作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明。谢谢! 1 简介 词性(part of speech)是词汇基本的语法范畴,通常也称为词类,主要用来描述一个词在上下文的作用。例如,描述一个概念的词就是名词,在下文引用这个名
阅读全文
posted @ 2016-12-12 17:58 老顽童2007
阅读(16848)
评论(8)
推荐(1)
编辑
2016年12月10日
Python标准模块--ContextManager
摘要: 1 模块简介 在数年前,Python 2.5 加入了一个非常特殊的关键字,就是with。with语句允许开发者创建上下文管理器。什么是上下文管理器?上下文管理器就是允许你可以自动地开始和结束一些事情。例如,你可能想要打开一个文件,然后写入一些内容,最后再关闭文件。这或许就是上下文管理器中一个最经典的
阅读全文
posted @ 2016-12-10 20:05 老顽童2007
阅读(24640)
评论(0)
推荐(5)
编辑
2016年12月1日
Python标准模块--Unicode
摘要: 1 模块简介 Python 3中最大的变化之一就是删除了Unicode类型。在Python 2中,有str类型和unicode类型,例如, Python 2.7.6 (default, Oct 26 2016, 20:30:19) [GCC 4.8.4] on linux2 Type "help",
阅读全文
posted @ 2016-12-01 18:36 老顽童2007
阅读(7369)
评论(0)
推荐(0)
编辑
2016年11月25日
Python标准模块--Iterators和Generators
摘要: 1 模块简介 当你开始使用Python编程时,你或许已经使用了iterators(迭代器)和generators(生成器),你当时可能并没有意识到。在本篇博文中,我们将会学习迭代器和生成器是什么。当然,我们也会了解如何创建它们,在我们需要的时候,就可以创建属于我们自己的迭代器和生成器。 2 模块使用
阅读全文
posted @ 2016-11-25 18:45 老顽童2007
阅读(601)
评论(0)
推荐(0)
编辑
2016年11月23日
结巴分词3--基于汉字成词能力的HMM模型识别未登录词
摘要: 作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明。谢谢! 1 算法简介 在 "结巴分词2 基于前缀词典及动态规划实现分词" 博文中,博主已经介绍了基于前缀词典和动态规划方法实现分词,但是如果没有前缀词典或者有些词不在前缀词典
阅读全文
posted @ 2016-11-23 08:01 老顽童2007
阅读(12317)
评论(2)
推荐(4)
编辑
2016年11月21日
结巴分词2--基于前缀词典及动态规划实现分词
摘要: 作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明。谢谢! 1 简介 jieba分词主要是基于统计词典,构造一个前缀词典;然后利用前缀词典对输入句子进行切分,得到所有的切分可能,根据切分位置,构造一个有向无环图;通过动态规划算
阅读全文
posted @ 2016-11-21 08:11 老顽童2007
阅读(12913)
评论(5)
推荐(1)
编辑
2016年11月20日
Python标准模块--asyncio
摘要: 1 模块简介 asyncio模块作为一个临时的库,在Python 3.4版本中加入。这意味着,asyncio模块可能做不到向后兼容甚至在后续的Python版本中被删除。根据Python官方文档,asyncio通过coroutines、sockets和其它资源上的多路复用IO访问、运行网络客户端和服务
阅读全文
posted @ 2016-11-20 21:11 老顽童2007
阅读(2193)
评论(4)
推荐(0)
编辑
2016年11月18日
结巴分词1--结巴分词系统介绍
摘要: 作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明。谢谢! 0 起因 由于博主之前做了一些文本挖掘的项目,在项目中或多或少的用到了分词模块,对于中文分词,博主一般使用Python开发的 "jieba分词" 组件。最近,博主想阅
阅读全文
posted @ 2016-11-18 08:16 老顽童2007
阅读(10920)
评论(0)
推荐(3)
编辑
2016年11月15日
Python标准模块--concurrent.futures
摘要: 1 模块简介 concurrent.futures模块是在Python3.2中添加的。根据Python的官方文档,concurrent.futures模块提供给开发者一个执行异步调用的高级接口。concurrent.futures基本上就是在Python的threading和multiprocess
阅读全文
posted @ 2016-11-15 19:55 老顽童2007
阅读(2971)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
下一页