摘要: 介绍 正则表达式是一种处理字符串的强大工具,能实现字符串的检索、替换、匹配验证等。在爬虫中,正则表达式主要用于从HTML里提取所需要的信息 常用的匹配规则 模式|描述 | \w|匹配字母、数字及下划线 \W|匹配不是字母、数字及下划线的字符 \s|匹配任意空白字符,等价于[\t\n\r\f] \S| 阅读全文
posted @ 2018-09-03 18:19 HackHarry 阅读(241) 评论(0) 推荐(0) 编辑