wdnmd

爬虫初试

在猪师的手把手教导下体验了下爬虫，

首先是进入anaconda官网，选择一个版本下载

安装时候，记住要勾选带path的选项。

避免python版本混乱

然后初试request跟re模块的用法，直接import即可，

爬取百度，但是出现乱码

把.text改为.content.decode("utf-8")即可。

加入正则

然后读取一个特定的标签

首先引入lxml这个包， cmd中用conda install lxml安装

其中//代表不管前面的父元素，title是一个标签，/text()是获取标签里面的文本。

这里的网页也可以直接用api，若一些需要参数的api，写入请求即可。

posted @ 2020-06-15 23:18 FreshChick 阅读(115) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列：如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示

阅读排行：
· Manus重磅发布：全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后，我竟然真的恢复了删除的微信聊天记录！
· 没有Manus邀请码？试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix

公告

昵称： FreshChick
园龄： 4年11个月
粉丝： 1
关注： 2

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:vue+less换肤，主题切换方案
@97z4moon 确实，害，当年查的时候就是查的vue的方案，见谅～屑屑指出...
--FreshChick
2. Re:vue+less换肤，主题切换方案
@FreshChick 而且还是ES5-，但凡用的动态引入都不会这么原始...
--97z4moon
3. Re:vue+less换肤，主题切换方案
@FreshChick vue是数据驱动视图，less是设置全局变量。你切换主题用的是原生JS DOM操作，less只是将less解析成了css，原理上仍然是JS和css，真正的标题应该是Vue&L...
--97z4moon
4. Re:vue+less换肤，主题切换方案
@97z4moon 项目是vue的项目，也是用的less，没毛病啊doge...
--FreshChick
5. Re:vue+less换肤，主题切换方案
实现方式跟vue和less没有半点关系。。
--97z4moon