2020 年 5月 21 日随笔档案 - cltt

2020年5月21日

实战 7 淘宝商品信息定向爬虫

摘要： import requests import re def getHTMLText(url): try: #淘宝用了反爬虫机制，必须提取cookie让他认为是用户在操作 headers = { "user-agent": "Mozilla/5.0", "cookie": "miid=16121344 阅读全文

posted @ 2020-05-21 12:20 cltt 阅读(913) 评论(0) 推荐(0) 编辑

正则表达式

摘要：正则表达式：regular expression regex RE 正则表达式是用来简洁表达一组字符串的表达式通用的字符串表达框架简洁表达一组字符串的表达式针对字符串表达“简洁”和“特征”思想的工具判断某字符串的特征归属正则表达式在文本处理中十分常用表达文本类型的特征（病毒、入侵等）同阅读全文

posted @ 2020-05-21 08:37 cltt 阅读(184) 评论(0) 推荐(0) 编辑

实战 7 淘宝商品信息定向爬虫

正则表达式

导航

公告