lzhenf

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2012年3月6日

摘要: 主要包括4个文件,util.py文件主要负责截取每个块。rules.py文件定义两个类,超类Rule和分别对应的子类,子类定义了不同的划分块的要求,子类包换action函数,调用handler处理handlers.py定义了处理类,超类定义了方法,子类通过名字调用markup.py定义了超类parser,定义了子类basicTextParser,超类主要负责创造过滤器,添加规则,对每个块执行处理。#handler.py# -*- coding: cp936 -*-class Handler: """ 处理从parser调用的方法对象 这个解析器会在每个块的开始部分 阅读全文
posted @ 2012-03-06 15:47 lzhenf 阅读(2379) 评论(0) 推荐(0) 编辑

摘要: 【转自:http://www.ibm.com/developerworks/cn/linux/sdk/python/python-5/index.html#N1004E】我们谈到“文本处理”时,我们通常是指处理的内容。Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。然而 .read() 生成文件内容最直接的字符串表示,但对于连续的面 阅读全文
posted @ 2012-03-06 15:34 lzhenf 阅读(696) 评论(0) 推荐(0) 编辑