2018 年 4月 26 日随笔档案 - Mr.SSC

2018年4月26日

摘要：从页面中提取数据的核心技术是HTTP文本解析，在python中常用的模块处理： BeautifulSoup 非常流行的解析库，API简单，但解析的速度慢。 lxml 是一套使用c语言编写的xml解析库，解析速度快，API相对比较复杂。 Scrapy中的Selector类是基于lxml库建立的，并且简阅读全文

posted @ 2018-04-26 00:18 Mr.SSC 阅读(6939) 评论(0) 推荐(2) 编辑

本心从未变

You only get one life.It's actually your duty to live it as fully as possible.

公告