立业的博客 - 博客园

2019年11月13日

摘要： ElementTree API尽可能避免使用前缀，而是使用命名空间(URI) 创建带前缀和命名空间的xml树 # coding:utf-8 from lxml import etree #当使用命名空间http://www.w3.org/1999/xhtml时，会自动创建前缀html，并让其与之关联阅读全文

posted @ 2019-11-13 15:43 立业的博客阅读(204) 评论(0) 推荐(0) 编辑

2019年11月12日

XML

摘要：关于命名空间 PCDATA 和 CDATA DTD的使用 DTD - XML模块构建 DTD - 实体 DTD - 属性阅读全文

posted @ 2019-11-12 17:38 立业的博客阅读(111) 评论(0) 推荐(0) 编辑

关于命名空间

摘要：命名空间的作用是为了避免元素命名冲突命名冲突在XML中，元素名称是自定义的，当两个不同的XML树在同一个文档中使用相同的元素名时，就会发生命名冲突，如下：它们都使用到了<table>，XML解析器无法确定如何处理这类冲突  <table> <tr> <td 阅读全文

posted @ 2019-11-12 17:37 立业的博客阅读(178) 评论(0) 推荐(0) 编辑

2019年11月11日

事件驱动解析

摘要：有时我们需要的只是树内某个地方的一小部分，因此将整个树解析到内存中，全体遍历并进行相关操作造成的内存开销会很大因此，etree提供了两个事件驱动的解析器接口一个是在构建树时，生成解析器事件(iterparse)另一个根本不构建树，而是以类似SAX的方式调用目标对象的反馈方法 some_file_li 阅读全文

posted @ 2019-11-11 16:18 立业的博客阅读(278) 评论(0) 推荐(0) 编辑

解析文件和字符串

摘要： etree支持以多种方式和所有重要来源解析XML，即字符串、文件、url(http/ftp)和类文件对象主要的解析函数是fromstring()和parse()，都是以源作为第一个参数调用的默认情况下，它们使用标准解析器，但您始终可以将不同的解析器作为第二个参数传递 fromstring()函数 s 阅读全文

posted @ 2019-11-11 15:35 立业的博客阅读(319) 评论(0) 推荐(0) 编辑

2019年11月4日

运维

摘要： CPU参数指标说明阅读全文

posted @ 2019-11-04 15:09 立业的博客阅读(143) 评论(0) 推荐(0) 编辑

CPU参数指标说明

摘要： %user %user表示CPU一共花了多少比例的时间运行在用户态空间或者说是用户进程(running user space processes) 典型的用户态空间程序有：Shells、数据库、web服务器…… %nice %nice表示改变过优先级的进程所占用CPU的百分比当使用top或者ps命阅读全文

posted @ 2019-11-04 15:07 立业的博客阅读(1197) 评论(0) 推荐(0) 编辑

2019年11月3日

跳出"低水平勤奋陷阱"

摘要： "低水平勤奋陷阱"：摘记更多的知识读书是获得知识的最基本，最重要的方式，但读书需要方法所谓"低水平勤奋陷阱"，就是花费了大量的时间和精力，但得到的结果却微乎其微，完全达不到期望或不成比例那是为什么呢，当然是方法不对，也就是方法太原始，因此"低水平勤奋"就是在原始方法的基础上进行努力这就是为什阅读全文

posted @ 2019-11-03 21:03 立业的博客阅读(370) 评论(0) 推荐(0) 编辑

2019年10月31日

对象解析

摘要：默认情况下，lxml.etree使用标准解析器创建一个解析器，在解析时删除标记之间的空文本如果事先知道纯空白内容对数据没有意义，则可以减小树的大小并避免尾部文本悬空阅读全文

posted @ 2019-10-31 11:59 立业的博客阅读(182) 评论(0) 推荐(0) 编辑

增量解析

摘要： lxml.etree提供的用于增量解析的方式有以下两种：方式一通过file-like对象不断的调用read()方法当数据源是从urllib 或其他file-like对象时，推荐使用该方式注意，在这种情况下，解析器将阻塞并等待数据变为可用方式二通过feed(data)和close()方法提供阅读全文

posted @ 2019-10-31 11:32 立业的博客阅读(225) 评论(0) 推荐(0) 编辑