摘要:
爬虫项目爬取猫眼电影TOP100电影信息 项目内容来自:https://github.com/Germey/MaoYan/blob/master/spider.py 由于其中需要爬取的包含电影名字、电影海报图片、演员、上映时间等众多信息,正则表达式代码较为复杂 在parse_one_page(htm 阅读全文
摘要:
Decorator #装饰器 装饰器是什么?顾名思义,就是用来“装饰”的: 装饰器是一个很著名的设计模式,(也和开闭原则有关)经常被用于有切面需求的场景,较为经典的有插入日志、性能测试、事务处理等。装饰器是解决这类问题的绝佳设计,有了装饰器,我们就可以抽离出大量函数中与函数功能本身无关的雷同代码并继 阅读全文
摘要:
#正则表达式内容非常多,网上的学习资源也是目不暇接,我从中筛选学习并且整理出以下 的学习笔记 一、正则表达式匹配过程: 1.依次拿出表达式和文本中的字符比较 2.如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败 3.如果表达式中有量词或边界,这个过程会稍微有一些不同 二、语法规则 阅读全文