摘要:
接着上一篇相关文章,还是说伯乐在线这个网站上有一个面向对象栏目。这次呢,不看妹子要求男生的身高问题,来瞧一瞧妹子在这个栏目上发帖子寻找soul mate的时间:) 实际上呢,网页信息是跟上次的一模一样,也就是说完全可以将上篇文章的网页代码保存在本地,设置好间隔符,通过不同的过滤... 阅读全文
摘要:
最近在朋友的博客里看到了一篇文章,是讲伯乐在线这个网站上有一个面向对象栏目。什么是面向对象呢,面向对象是一个专门为IT单身男女服务的征友传播平台,由伯乐在线专门为程序员爱情创立的一个公益+免费活动。简单来说,网站的女用户在这个栏目组发帖子,包括自己的相关信息,以及理想的男友条件,男... 阅读全文
摘要:
pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,使用方法:from pyquery import PyQuery as pq可加载一段HTML字符串,或一个HTML文件,或是一个url地址,例:d = pq("hello")d = pq(filena... 阅读全文
摘要:
XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初 XPath 的提出的初衷是将其作为一个通用的、介于XPointer与XSLT间的语法模型。但是 XPath ... 阅读全文