Python爬虫——将爬取的数据存入excle

本性项目从淘车网爬取数据并将爬下来的数据生成excle表格

安装 lxml和XlsxWriter库的时候飘红,从Terminal和Python interpreter安装都不行,最后试了试cmd

 用到了清华镜像加速:-i https://pypi.tuna.tsinghua.edu.cn/simple

 

好像是先从cmd用清华镜像装,再从Python interpreter装,刚开始Python interpreter也装不上

 

 

复制代码
# -*- codeing = utf-8 -*-
# @Time : 2022/5/6 21:42 下午
# @Auther :ywx
# @File : 爬虫2.py
# @Software: PyCharm
import requests
import xlrd
import xlwt
from lxml import etree
import xlsxwriter

url='https://beijing.taoche.com/landrover/'
#设置请求头
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36 Edg/100.0.1185.50'}
#通过状态码判断网页请求是否成功
def get(uel):
    response = requests.get(url,headers=headers)
    if response.status_code==200:
     print("success!")
    else:
     print("false")
#爬虫部分
def parse(url):
    response = requests.get(url, headers=headers)
    #定义选择器
    selector = etree.HTML(response.text)
    name = selector.xpath('//a/span/text()')
    originalprice = selector.xpath('//i[@class="onepaynor"]/text()')
    print(name,originalprice)

    # for i in range(len(name)):
    #print(name[i], originalprice[i])

    #创建表格
    workbook = xlsxwriter.Workbook('taoche_spider.xlsx')
    worksheet = workbook.add_worksheet()
    for i in range(len(name)):
        #在第i行,第1列,写入originalprice
        worksheet.write(i,0,name[i])
    for i in range(len(originalprice)):
        worksheet.write(i, 1, originalprice[i])
    workbook.close()



get(url)
parse(url)
复制代码

创建表格的代码运行的时候出现 IndexError: list index out of range报错,刚开始以为是数组下标越界,后来发现是因为调用len(name)只能返回name[i],再返回 originalprice的时候 originalprice不在它的范围里。

 

 

posted @   七月猫合  阅读(429)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
点击右上角即可分享
微信分享提示