2016年6月17日
摘要: 看完了BeautifulSoup的官方文档, 今天试着爬了一波自家学校moodle, 写了一个简陋查分器, 还算是成功, 代码已经扔在github上了, 感兴趣的朋友可以去看看. https://github.com/zhang77595103/web-crawler 今天模仿大神xlzd, 准备先 阅读全文
posted @ 2016-06-17 23:58 内脏坏了 阅读(2813) 评论(0) 推荐(0) 编辑
摘要: prettify()能返回一个格式良好的html的Unicode字符串 : 但是你只是想要一个代表该html的字符串, 并不在乎它的格式, 你可以使用str()或者unicode()...这里str()返回的是格式为utf8的字符串, 你可以使用encode使它变为bytestring或者decod 阅读全文
posted @ 2016-06-17 11:14 内脏坏了 阅读(331) 评论(0) 推荐(0) 编辑
摘要: 修改html树无非是对其中标签的改动, 改动标签的名字(也就是类型), 属性和标签里的内容... 先讲这边提供了很方便的方法来对其进行改动... 然后是改动内容 : 当然你还可以用append(), 我让我奇怪的是使用append()之后的效果看上去是一样的, 但是调用.contents却会发现其实 阅读全文
posted @ 2016-06-17 10:45 内脏坏了 阅读(949) 评论(0) 推荐(0) 编辑