开始第一个自己的python爬虫程序爬磁力链

不能一事无成，这么久了学python还是吊着，要落地，落在博客园好了，好像公司也只能上博客园了

昨天看了一篇用正则爬电影天堂的视频，直接拿来用，爬磁力吧，爬好玩的

 1 #导入模块
 2 import requests
 3 import re
 4 
 5 #用一个变量接受输入
 6 input_name = input("输入关键字搜索:")
 7 
 8 for n in range(1,2): #n是页码 看情况，想多搜就放大点
 9     # 网址 用+ +进行拼接，还很好用
10     a_url = 'https://www.ciliba.org/s/'+input_name+'_rel_'+str(n)+'.html'  
11     html_1 = requests.get(a_url)
12     html_1.encoding = 'utf-8' #转码
13     print(html_1.status_code) #返回码为200则说明能爬
14     detail_list = re.findall('<div class="item-title"><h3><a href="(.*?)" target="_blank',html_1.text)
15     #print(detail_list)
16     for m in detail_list:
17         html_2 = requests.get(m)
18         html_2.encoding = 'utf-8'
19         ftp = re.findall('资源下载：<a href="(.*?)" class="download" >磁力链接</a>',html_2.text)
20         #print(ftp)
21         with open('C:\\Users\\wyx\\Desktop\\'+input_name+'的磁力链.txt','a',encoding='utf-8') as ff:
22                  ff.write(ftp[0]+'\n')
23 print("the search is done")

最后在桌面上形成相关关键字的文件，我试了苍老师，可以的

很入门，努力中

发表于 2018-03-26 22:20 码码忙盲阅读(3309) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

开始 第一个自己的python爬虫程序 爬磁力链

公告

开始第一个自己的python爬虫程序爬磁力链