2019 年 5月随笔档案 - 小菜技术

python爬虫---实现项目(一) Requests爬取HTML信息

摘要：上面的博客把基本的HTML解析库已经说完了，这次我们来给予几个实战的项目。这次主要用Requests库+正则表达式来解析HTML。项目一：爬取猫眼电影TOP100信息代码地址：https://gitee.com/dwyui/maoyan-Requests.git 项目二：美食爬取（包含多层爬取阅读全文

posted @ 2019-05-31 01:05 小菜技术阅读(1316) 评论(0) 推荐(0) 编辑

python爬虫---从零开始（六）Selenium库

摘要：什么是Selenium库：自动化测试工具，支持多种浏览器。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera等。爬虫中主要用来解决JavaScript渲染的问题。用于驱动浏览器，并且给予浏览器动作。安装S 阅读全文

posted @ 2019-05-30 01:32 小菜技术阅读(461) 评论(0) 推荐(0) 编辑

python爬虫---从零开始（五）pyQuery库

摘要：什么是pyQuery：强大又灵活的网页解析库。如果你觉得正则写起来太麻烦（我不会写正则），如果你觉得BeautifulSoup的语法太难记，如果你熟悉JQuery的语法，那么PyQuery就是你最佳的选择。 pyQuery的安装pip3 install pyquery即可安装啦。 pyQuery的阅读全文

posted @ 2019-05-28 22:02 小菜技术阅读(278) 评论(0) 推荐(0) 编辑

python爬虫---从零开始（四）BeautifulSoup库

摘要：BeautifulSoup是什么？ BeautifulSoup是一个网页解析库，相比urllib、Requests要更加灵活和方便，处理高校，支持多种解析器。利用它不用编写正则表达式即可方便地实现网页信息的提取。 BeautifulSoup的安装：直接输入pip3 install beautifu 阅读全文

posted @ 2019-05-28 00:52 小菜技术阅读(308) 评论(0) 推荐(0) 编辑

python爬虫---从零开始（三）Requests库

摘要：1，什么是Requests库 Requests是用python语言编写，基于urllib，采用Apache2 Licensed 开源协议的HTTP库。它比urllib更加方便，可以节约我们大量的工作，完全满足HTTP测试需求，用一句话来说，Requests是 python实现的简单易用的HTTP库阅读全文

posted @ 2019-05-26 23:04 小菜技术阅读(368) 评论(0) 推荐(0) 编辑

python爬虫---从零开始（二）Urllib库

摘要：urllib库的使用方法阅读全文

posted @ 2019-05-26 02:49 小菜技术阅读(368) 评论(0) 推荐(0) 编辑

python爬虫---从零开始（一）初识爬虫

摘要：初识爬虫阅读全文

posted @ 2019-05-24 13:14 小菜技术阅读(772) 评论(0) 推荐(0) 编辑

小菜技术

05 2019 档案

公告

搜索

积分与排名

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论