点击此处浏览总目录
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 40 下一页
摘要: ElementTree API尽可能避免使用前缀,而是使用命名空间(URI) 创建带前缀和命名空间的xml树 # coding:utf-8 from lxml import etree #当使用命名空间http://www.w3.org/1999/xhtml时,会自动创建前缀html,并让其与之关联 阅读全文
posted @ 2019-11-13 15:43 立业的博客 阅读(204) 评论(0) 推荐(0) 编辑
摘要: 关于命名空间 PCDATA 和 CDATA DTD的使用 DTD - XML模块构建 DTD - 实体 DTD - 属性 阅读全文
posted @ 2019-11-12 17:38 立业的博客 阅读(111) 评论(0) 推荐(0) 编辑
摘要: 命名空间的作用是为了避免元素命名冲突 命名冲突 在XML中,元素名称是自定义的,当两个不同的XML树在同一个文档中使用相同的元素名时,就会发生命名冲突,如下:它们都使用到了<table>,XML解析器无法确定如何处理这类冲突 <!--以下表示HTML表格的信息--> <table> <tr> <td 阅读全文
posted @ 2019-11-12 17:37 立业的博客 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 有时我们需要的只是树内某个地方的一小部分,因此将整个树解析到内存中,全体遍历并进行相关操作造成的内存开销会很大因此,etree提供了两个事件驱动的解析器接口一个是在构建树时,生成解析器事件(iterparse)另一个根本不构建树,而是以类似SAX的方式调用目标对象的反馈方法 some_file_li 阅读全文
posted @ 2019-11-11 16:18 立业的博客 阅读(278) 评论(0) 推荐(0) 编辑
摘要: etree支持以多种方式和所有重要来源解析XML,即字符串、文件、url(http/ftp)和类文件对象主要的解析函数是fromstring()和parse(),都是以源作为第一个参数调用的默认情况下,它们使用标准解析器,但您始终可以将不同的解析器作为第二个参数传递 fromstring()函数 s 阅读全文
posted @ 2019-11-11 15:35 立业的博客 阅读(319) 评论(0) 推荐(0) 编辑
摘要: CPU参数指标说明 阅读全文
posted @ 2019-11-04 15:09 立业的博客 阅读(143) 评论(0) 推荐(0) 编辑
摘要: %user %user表示CPU一共花了多少比例的时间运行在用户态空间或者说是用户进程(running user space processes) 典型的用户态空间程序有:Shells、数据库、web服务器…… %nice %nice表示改变过优先级的进程所占用CPU的百分比 当使用top或者ps命 阅读全文
posted @ 2019-11-04 15:07 立业的博客 阅读(1197) 评论(0) 推荐(0) 编辑
摘要: "低水平勤奋陷阱":摘记更多的知识 读书是获得知识的最基本,最重要的方式,但读书需要方法 所谓"低水平勤奋陷阱",就是花费了大量的时间和精力,但得到的结果却微乎其微,完全达不到期望或不成比例 那是为什么呢,当然是方法不对,也就是方法太原始,因此"低水平勤奋"就是在原始方法的基础上进行努力 这就是为什 阅读全文
posted @ 2019-11-03 21:03 立业的博客 阅读(370) 评论(0) 推荐(0) 编辑
摘要: 默认情况下,lxml.etree使用标准解析器 创建一个解析器,在解析时删除标记之间的空文本如果事先知道纯空白内容对数据没有意义,则可以减小树的大小并避免尾部文本悬空 阅读全文
posted @ 2019-10-31 11:59 立业的博客 阅读(182) 评论(0) 推荐(0) 编辑
摘要: lxml.etree提供的用于增量解析的方式有以下两种: 方式一 通过file-like对象不断的调用read()方法 当数据源是从urllib 或其他file-like对象时,推荐使用该方式注意,在这种情况下,解析器将阻塞并等待数据变为可用 方式二 通过feed(data)和close()方法提供 阅读全文
posted @ 2019-10-31 11:32 立业的博客 阅读(225) 评论(0) 推荐(0) 编辑
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 40 下一页