如何利用python模仿浏览器进行网页爬取？

http://wwwsearch.sourceforge.net/mechanize/

http://www.ibm.com/developerworks/cn/linux/l-python-mechanize-beautiful-soup/

http://blog.csdn.net/cnmilan/article/details/9199181

简单讲可以利用mechanize库来实现这一功能：

import mechanize

URL = 'http://yoururl.com'

br = mechanize.Browser()
br.set_handle_robots() #这一句是用来绕过那些防止机器爬虫的网站的设置
response = br.open(URL)
sourcecode = response.read()

posted @ 2015-04-08 11:16 Xander-Hang 阅读(418) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语，封装的思维：从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热？
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现

阅读排行：
· 周边上新：园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源！
· 分享 3 个 .NET 开源的文件压缩处理库，助力快速实现文件压缩解压功能！
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试？测试工程师会被淘汰吗？

公告

昵称： Xander-Hang
园龄： 9年11个月
粉丝： 72
关注： 5

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类 (84)

随笔档案 (98)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:网易游戏——两年测试工作体会
因为收到offer看到了这篇博客，想问下楼主之后转做什么工作了呢？对这个岗位的发展前景很迷茫。
--ConfusedFish
2. Re:中大东校小米路由器mini实现inode上网，ipv6 wifi【中大】【东校】【inode】【ipv6】
楼主能不能私发个h3c，链接挂了
--stardxw
3. Re:Python股票分析系列——基础股票数据操作（二）.p4
O(∩_∩)O谢谢
--Saruka的男朋友
4. Re:Python股票分析系列——基础股票数据操作（二）.p4
好
--Saruka的男朋友
5. Re:[转载]python中的@符号的作用
感谢解决了疑问
--oceanRain
6. Re:利用python爬取海量疾病名称百度搜索词条目数的爬虫实现
大佬能分享下源码吗？1366143083@qq.com 谢谢
--心冷2080
7. Re:Python股票分析系列——获得标普500的所有公司股票数据.p6
运行之后，提示错误，请问怎么修改啊？KeyError: 'Date'During handling of the above exception, another exception occurred...
--tangpaul
8. Re:网易游戏——两年测试工作体会
@ justyyy这么讲吧，国内游戏行业就两个大佬，一个腾讯一个网易，而测试业界游戏测试又是非常特殊的，网易公司又是使用自研引擎。如果，你不是计划长久待在网易而又要一直做游戏测试开发，那么你应该心里有...
--Xander-Hang
9. Re:网易游戏——两年测试工作体会
请问下楼主，网易游戏测试开发的前景不好吗
--justyyy
10. Re:网易游戏——两年测试工作体会
想问一下楼主，网易的餐是公司饭堂的还是统一订的外卖？同科韵路附近，吃饭成问题……
--batsing