2020年5月21日

实战 7 淘宝商品信息定向爬虫

摘要: import requests import re def getHTMLText(url): try: #淘宝用了反爬虫机制,必须提取cookie让他认为是用户在操作 headers = { "user-agent": "Mozilla/5.0", "cookie": "miid=16121344 阅读全文

posted @ 2020-05-21 12:20 cltt 阅读(888) 评论(0) 推荐(0) 编辑

正则表达式

摘要: 正则表达式:regular expression regex RE 正则表达式是用来简洁表达一组字符串的表达式 通用的字符串表达框架 简洁表达一组字符串的表达式 针对字符串表达“简洁”和“特征”思想的工具 判断某字符串的特征归属 正则表达式在文本处理中十分常用 表达文本类型的特征(病毒、入侵等) 同 阅读全文

posted @ 2020-05-21 08:37 cltt 阅读(184) 评论(0) 推荐(0) 编辑

导航