随笔分类 - 4.1 shell/python/perl
脚本语言
摘要:说明 使用chrome浏览器。 环境 windows 参考 selenium+python爬虫全流程教程 前面 的安装过程 思路 查看浏览器chrome 版本,这里是 98.0.4758.102, 去官网下载 驱动程序 安装python 依赖包 selenium,这里装完后是 4.3.0 linux
阅读全文
摘要:知识细节概括 浏览器反爬技术 验证请求header 验证refer 参数 动态渲染 判断请求频率,太快封掉ip 判断请求ip,同一个ip 经常爬取,封ip 需要提供密码登录 通过cookie判断 用验证码等技术 不提供web 数据,只提供手机APP 制定 robots文件,约定哪些能爬,哪些不能 异
阅读全文
摘要:参考 Python必会的单元测试框架 —— unittest
阅读全文
摘要:Out: 参考资料: http://www.runoob.com/python/python-gui-tkinter.html Tkinter 组件 Tkinter的提供各种控件,如按钮,标签和文本框,一个GUI应用程序中使用。这些控件通常被称为控件或者部件。 目前有15种Tkinter的部件。我们
阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:1 队列读写 2 队列实现生产者、消费者
阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:1. Code Out: 995 -5 892 -103 814 -78 694 -120 668 -26 550 -118 482 -68 423 -59 293 -130 188 -105 193 5 325 132 473 148 535 62 539 4 677 138 738 61 875
阅读全文
摘要:代码: 2 输出: D:\Programs\Anaconda\python.exe D:/1_practice/python/projects/downloads_modify/归类/并发/thread_sync_5.py c1 c2 c3 m1 p1m2 p2 p5 ('num:', 1, 'pr
阅读全文
摘要:
阅读全文
摘要:代码: 输出: 基准,以上代码执行 main end 03:58 0->1 03:58 1->2 04:00 2->3 04:00 3->4 04:02 4->5 04:02 5->6 04:04 6->7 04:04 7->8 04:06 8->9 04:06 9->10 04:08 10->11
阅读全文
摘要:Out1 保证 在操作共享数据的地方,执行完线程1,再执行线程2 Out2 即使在线程1中加了锁,但是线程2没有加锁,两个代码在同时跑。 数据一致性无法保证
阅读全文
摘要:1 usePool.py 2 usePoolmap.py 3 usePoolgetData.py 4 usePoolCallback.py 使用回调函数 参考: python进程池:multiprocessing.pool
阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:总结: 代码: 输出: 格式说明: 小时 :秒,时间戳, <当前进程ID, [父 进程ID,当前进程线程数量]> root@ssmaster:~/python# python test_threadprocess1.py 03:04,1536397384.349529: main begin03:0
阅读全文