摘要: 环境安装 pip install PyExecJS(自己pip安装,安装成功后,最好重启下cmd终端和pycharm,或者重启电脑) 安装node.js开发环境:安装好了之后,记得重启电脑! js改写工具 PyExecJS介绍 PyExecJS 是一个可以使用 Python 来模拟运行 JavaSc 阅读全文
posted @ 2022-08-17 17:21 hanfe1 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 逆向重点掌握的内容: 1.逆向的思维 2.网站逆向的分析思路和步骤 注意:重点不是放在代码中,而是分析的思路和套路(技巧) 逆向到底是什么? 通俗来讲,逆向就是处理爬虫过程中对于加密数据的破解,和一些动态变化请求参数的处理。 js常见的加密方式 加密在前端开发和爬虫中是经常遇见的。掌握了加密算法且可 阅读全文
posted @ 2022-08-17 17:06 hanfe1 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 各种加密逻辑 ​ 在我们进行js逆向的时候. 总会遇见一些我们人类无法直接能理解的东西出现. 此时你看到的大多数是被加密过的密文. 一. 一切从MD5开始 (Message-Digest Algorithm ) MD5信息摘要算法(英语:MD5 Message-Digest Algorithm) M 阅读全文
posted @ 2022-08-17 17:00 hanfe1 阅读(1504) 评论(1) 推荐(0) 编辑
摘要: 简介 什么是框架? 所谓的框,其实说白了就是一个【项目的半成品】,该项目的半成品需要被集成了各种功能且具有较强的通用性。 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍。所谓的框架就是一个已经被集成了各种功能(高性能异步下载,队列,分布式,解析,持久化等)的具 阅读全文
posted @ 2022-08-17 16:39 hanfe1 阅读(202) 评论(0) 推荐(0) 编辑
摘要: MongoDB数据存储 MongoDB是一个非关系型数据库(NoSQL). 非常适合超大数据集的存储, 由 C++ 语言编写,旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。 下面是 阅读全文
posted @ 2022-08-17 16:28 hanfe1 阅读(46) 评论(0) 推荐(0) 编辑
摘要: M3U8流视频数据爬虫 HLS技术介绍 现在大部分视频客户端都采用HTTP Live Streaming,而不是直接播放MP4等视频文件(HLS,Apple为了提高流播效率开发的技术)。HLS技术的特点是将流媒体切分为若干【TS片段】(比如几秒一段),然后通过一个【M3U8列表文件】将这些TS片段批 阅读全文
posted @ 2022-08-17 16:19 hanfe1 阅读(1002) 评论(0) 推荐(0) 编辑
摘要: 1. 白话垃圾回收 用通俗的语言解释内存管理和垃圾回收的过程,搞懂这一部分就可以去面试、去装逼了… 1.1 大管家refchain 在Python的C源码中有一个名为refchain的环状双向链表,这个链表比较牛逼了,因为Python程序中一旦创建对象都会把这个对象添加到refchain这个链表中。 阅读全文
posted @ 2022-08-17 15:11 hanfe1 阅读(105) 评论(0) 推荐(0) 编辑