03 2014 档案
摘要:因为想把一段文字分词,所以,需要明确一定的词语关系。在网上随便下载了一篇中文小说。随便的txt小说,就1mb多。要数数这1mb多的中文到底有多少字,多少分词,这些分词的词性是什么样的。这里是思路1)先把小说读到内存里面去。2)再把小说根据正则表达法开始分词,获得小说中汉字总数3)将内存中的小说每段POST到提供分词服务的API里面去,获取分词结果4)按照API说明,取词素材:1、linux/GNU => debian/ubuntu 12.04/Linuxmint 13 Preferred2、python3、中文分词API, 这里我们使用的是 http://www.vapsec.com/f
阅读全文
摘要:There is a project which is deployed within django. So its authentication system is built from Django itself.But ususually we want to get good use of it. And we don't want to build another system to manage 'user' information.So, we can use django within tornado. I mean use tornado more.W
阅读全文
摘要:Supervisor 管理后台守护进程参考原文如下:http://codinn.com/people/brant/notes/110948/做了一些注释+++++++++++引用开始++++++++++++自己开发的应用往往也希望做到随系统自动启动, 而且启动之后最好还能方便的控制其停止/重启. 传统的做法是在/etc/init.d/下建立启动脚本, 但这个方法非常繁琐, 容易出错, 而且不同服务器/不同版本的配置又有差异.通常需要借助一些辅助工具. 常用的管理工具有runit,daemontools以及用 Python 开发的Supervisor. 其中以 Supervisor 最为易用,
阅读全文
摘要:原文地址:http://www.ruanyifeng.com/blog/2013/12/getting_started_with_postgresql.html期间,作者有写错的地方,已经做更改了。除了纯净的命令行来操作外,还可以使用pgadmin3 可视化工具来操作。我尝试了一下,感觉非常不错。结...
阅读全文
摘要:原文地址:http://www.cnblogs.com/pumaboyd/archive/2008/08/11/1265416.html红色的为标注信息+++++++++++++++++引用+++++++++++++++++++++>PY提供INI配置文件的操作关于配置文件,很直观的感觉就是XML文件。对于XML文件的使用大家还是很喜欢的。但有时候只是简单的一个程序,实现一个简单的name:value关系。用XML文件就没这个必要。这种要求很符合MS的INI文件格式。所以这里主要介绍一下对INI文件的操作方式,而且最近写的第一个PY应用程序也是使用了INI什么是INI 文件PY所支持的I
阅读全文