2012年10月28日

python入门(2)全局变量

摘要: 正如在上篇文章中看到的,在查找最底层的文档时用到了一个全局变量集合COUNT来保存当前目录下的所有文件。实际上在python的进一步应用中,经常会涉及到全局变量的问题,常见的全局变量有两种用法:第一:声明法:在文件开头声明Python全局变量variable,在具体函数中使用该变量时,需要事先声明 global variable,否则系统将该变量视为局部变量。 通常将全局变量用大写字母表示。例如上篇文章中要将最初目录下的所有文档路径记录下来以便下一个方法的处理,就用到了一个全局变量COUNTimport sysimport osCOUNT=set()def fun(path): for ... 阅读全文

posted @ 2012-10-28 21:46 翠竹林 阅读(1504) 评论(0) 推荐(0) 编辑

python入门(1)文档的处理

摘要: 最近在作一个有关自然语言处理的project,要处理大量的语料文本,而python这种脚本在处理字符串上又有其无可比拟的优势,所以就看了看这方面的书。以下是在做语料处理时遇到的一些问题,总结一下,也好以后再深入学习:第一个问题就是大量文本读入的问题,因为通过语料分词处理后会生成大量的文本文档,想实现对这些文本的批处理,python中一个很好的包os帮了忙:先在分词程序中将处理后的文档写入到同一文件夹下,这里就是“c:\data”吧,然后通过下面的代码实现:import sysimport os def fun(path):#path 是路径 for root,dirs,files in ... 阅读全文

posted @ 2012-10-28 21:29 翠竹林 阅读(542) 评论(0) 推荐(0) 编辑

导航