摘要:
python SGMLParser模块处理html解析非常的方便,它将HTML 处理分成三步:将 HTML 分解成它的组成片段,对片段进行加工,接着将片段再重新合成 HTML。第一步是通过 sgmllib.py 来完成的,它是标准 Python 库的一部分。理解本章的关键是要知道 HTML 不只是文本,更是结构化文本。这种结构来源于开始与结束标记的或多或少分级序列。通常您并不以这种方式处理 HTM... 阅读全文
posted @ 2010-06-13 22:43
老王python
阅读(5897)
评论(2)
推荐(2)
浙公网安备 33010602011771号