葫芦金刚

导航

检测2个url的不同之处(爬虫分析接口)

就是简单的检测2个url的不同之处,在做爬虫时,要分析接口地址的不同之处,靠自己的眼睛有点累,所以写了一个小程序,不喜勿喷

 

#测试数据
a = "https://list.tmall.com/search_product.htm?spm=a220m.1000858.1000724.5.31ed23ff7Mb3Bh&cat=50024400&brand=81156&q=%CA%D6%BB%FA&sort=p&style=g&from=sn_1_brand-qp&suggest=0_1&active=1&industryCatId=50024400#J_Filter"
b = "https://list.tmall.com/search_product.htm?spm=a220m.1000858.1000724.4.48bd23ffUsRB64&cat=50024400&brand=81156&q=%CA%D6%BB%FA&sort=d&style=g&from=sn_1_brand-qp&suggest=0_1&active=1&industryCatId=50024400#J_Filter"



#定义查找函数
def findd(s1,s2):
    #定义遍历次数lenght,并将s2的个数赋值给lenght
    lenght=len(s2)
    #判断2个url的长度,如果s1的个数大于s2的话,就讲s1的个数赋值给lenght
    if len(s1)>len(s2):
        lenght = len(s1)
    #定义2个空字符串,用于存放从s1,s2中找到的不同字符
    a = ""
    b = ""
    #遍历s1,s2
    for i in range(lenght):
        if s1[i]!=s2[i]:
            a +=s1[i]
            b +=s2[i]
    #测试时用的,可以注释掉
    print(a,b)
    #返回2个url的不同之处
    return a,b

findd(a,b)

 

posted on 2018-04-14 14:39  葫芦金刚  阅读(684)  评论(0编辑  收藏  举报