09 2021 档案
摘要:原文:https://www.cnblogs.com/cursorhu/p/6141365.html @、样式修改
阅读全文
摘要:@、字符串中的特殊编码转码 import html from urllib import parse def test_unicode(): # data = r'{"status":-5,"msg":"\u7528\u6237\u540d\u6216\u5bc6\u7801\u9519\u8bef
阅读全文
摘要:代码摘自书籍<<人人都懂设计模式>> 元类(C-8): class CustomMetaclass(type): def __init__(cls, what, bases=None, dict=None): # 这个方法只会调用一次 print('CustomMetaclass.__init__
阅读全文
摘要:@、修改http请求的返回值 原文:https://blog.csdn.net/binghuizi199293/article/details/80970344
阅读全文
摘要:全局解释器锁GIL(global interpreter lock) GIL是由CPython解释器所引入的锁机制。 GIL不会阻止进程在不同的处理器上执行,但同一时刻它只允许唯一的线程出现在解释器中。 GIL不能保证线程安全,在修改某共享变量的过程中可能被中断,并被其他线程先修改,当前线程再次运行
阅读全文
摘要:原文: https://blog.csdn.net/qq_26235879/article/details/113090603 https://blog.csdn.net/weixin_33902301/article/details/118046434 from lxml import etree
阅读全文
摘要:测试代码结构: 演示案例并没有进行网页爬取,主要目的是演示重复import的问题。 spider目录下是各个业务spider,把任务提交到crawler。 crawler中有个任务队列汇集各个业务spider提交的任务,然后在独立的线程中对任务进行实际的爬取动作。 main启动crawler及各个业
阅读全文