阿里云9.9元云服务器限时购买

python 根据中文表头标题抓取动态(表格)文档数据

思路

如图左侧表头标题,要获得右侧数据。网页数据提取成汉字,表格数据间会有空格,用split()分隔成list。用index()查找某个汉字表头位置,输出list下一个位置既是要得到值

    text2 ='网页纯文本,爬虫数据自己转换'
    # 字符串分割成列表,Python 分割字符串使用 变量.split("分割标示符号"[分割次数]),分割次数表示分割最大次数,为空则分割所有。
    list2 = text2.split()
    #列表根据内容查找某个值的位置,list2为列表的名字,p是查找的值在list的位置
    p = list2.index('查找的值,如管理规模区间')
    # v就是要获取的值,如20-50亿元
    v = list2[p + 1]  

  

posted @ 2021-10-25 08:11  HIIT  阅读(243)  评论(0编辑  收藏  举报
阿里云限时红包 最高 ¥ 2000 云产品通用红包,可叠加官网常规优惠使用