电商 Python 淘宝主图下载 淘宝详情图下载 考拉海购主图下载

# encoding: utf-8


import requests
from pymouse import PyMouse
from pykeyboard import *
import time
import pyperclip
import json
import os
import shutil
import re





# 动态添加jQuery引用:
'''
var script = document.createElement('script');script.src = "https://cdn.bootcdn.net/ajax/libs/jquery/1.12.4/jquery.min.js";
document.head.appendChild(script);
'''


# 考拉海购-主图下载
'''
var arr = [];
$("#litimgUl img").each(function (index) {
    var name = index+'';
    var url = $(this).attr("src");
    url = url.replace("?x-oss-process=image/resize,w_64/quality,q_85", "");
    arr.push({
        name: name,
        url: url
    });
});
var str1 = JSON.stringify(arr);
console.log(str1);
'''



# 淘宝分类名称和图片
'''
var arr = [];
$("ul.J_TSaleProp li a").each(function (index) {
    var item = $("ul.J_TSaleProp li a")[index];
    var url = $(item).attr("style");
    if (url != null){
        url = "http://" + url.replace("background:url(//", "").replace("_30x30.jpg) center no-repeat;", "");
    }
    var name = $(item).find("span").eq(0).text();

    arr.push({
        name: name,
        url: url
    });
});
var str1 = JSON.stringify(arr);
console.log(str1);
'''




# 淘宝详情图下载
'''
var arr = [];
var index=0;
$("#J_DivItemDesc p img").each(function (index) {
    var url = $(this).attr("src");
    index++;
    arr.push({
        name: index+'',
        url: url
    });
});
var str1 = JSON.stringify(arr);
console.log(str1);
'''






arr=[]
with open('data.json.txt', 'r', encoding='utf-8') as f:# 从本地文件读取json数据
    arr = json.load(f)



# 创建目录,存在就清空
# 原文:https://www.cnblogs.com/kaerxifa/p/13432173.html
def setDir(filepath):
    if not os.path.exists(filepath):
        os.mkdir(filepath)
    else:
        shutil.rmtree(filepath)
        os.mkdir(filepath)


# 替换或去除不能用于文件名的字符
# https://blog.csdn.net/qq_29303759/article/details/81944733
def validateTitle(title):
    rstr = r"[\/\\\:\*\?\"\<\>\|]"  # '/ \ : * ? " < > |'
    new_title = re.sub(rstr, "_", title)  # 替换为下划线
    return new_title



# 下载分类图片
def download():
    setDir('./图片/')
    print('准备下载图片!')
    for inx, val in enumerate(arr):
        print(inx)
        name = str(inx+1) + '_' + val['name'] + '.jpg'
        name = validateTitle(name)
        html = requests.get(val['url'])
        with open("./图片/" + name , "wb") as f:
            f.write(html.content)    



# 复制内容道淘宝分类
def copy_taobao():
    print('准备粘贴内容!')
    m = PyMouse()
    k = PyKeyboard()
    time.sleep(5)
    for inx, val in enumerate(arr):
        print(inx)
        pyperclip.copy(val['name'])
        time.sleep(3)
        
        k.press_key(k.control_key)
        time.sleep(1)
        k.tap_key('v')
        time.sleep(1)
        k.release_key(k.control_key)
        time.sleep(1)


download()

 
            
     

            

posted @   古兴越  阅读(219)  评论(0编辑  收藏  举报
编辑推荐:
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之:什么是图片特征编码
· .NET 9 new features-C#13新的锁类型和语义
阅读排行:
· Spring AI + Ollama 实现 deepseek-r1 的API服务和调用
· 《HelloGitHub》第 106 期
· 数据库服务器 SQL Server 版本升级公告
· 深入理解Mybatis分库分表执行原理
· 使用 Dify + LLM 构建精确任务处理应用
点击右上角即可分享
微信分享提示