2019 年 1月 14 日随笔档案 - Tanglaoer

2019年1月14日

摘要：一个Python操作mongodb的模块阅读全文

posted @ 2019-01-14 23:56 Tanglaoer 阅读(179) 评论(0) 推荐(0) 编辑

摘要：以下纯属搬砖，我用Python抓取的redis命令列表页内容如果想看命令的具体使用可查去官网查看，以下整理为个人查找方便而已阅读全文

posted @ 2019-01-14 23:40 Tanglaoer 阅读(3026) 评论(0) 推荐(0) 编辑

摘要：一、简介正则表达式本身是一种小型的、高度专业化的编程语言，而在python中，通过内嵌集成re模块，程序媛们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码，然后由用C编写的匹配引擎执行。二、正则表达式中常用的字符含义 1、普通字符和11个元字符：普通字符匹配自身 abc a 阅读全文

posted @ 2019-01-14 18:25 Tanglaoer 阅读(477) 评论(0) 推荐(0) 编辑

Python开发文件操作

摘要：阅读目录 1、读写文件 open()将会返回一个file对象，基本语法： open(filename,mode) filename:是一个包含了访问的文件名称的路径字符串 mode:决定了打开文件的模式：只读，写入，追加等，默认文件访问模式为只读(r) 不同模式打开文件的列表： r：以只读的方式打开阅读全文

posted @ 2019-01-14 17:47 Tanglaoer 阅读(276) 评论(0) 推荐(0) 编辑

scrapy formRequest 表单提交

摘要： scrapy.FormRequest 主要用于提交表单数据先来看一下源码参数： formdata (dict or iterable of tuples) – is a dictionary (or iterable of (key, value) tuples) containing HTML 阅读全文

posted @ 2019-01-14 17:31 Tanglaoer 阅读(1017) 评论(0) 推荐(0) 编辑

scrapy CrawlSpider解析

摘要： CrawlSpider继承自Spider, CrawlSpider主要用于有规则的url进行爬取。先来说说它们的设计区别： SpiderSpider 类的设计原则是只爬取 start_urls 中的url，而 CrawlSpider 类定义了一些规则 rules 来提供跟进链接 link 的方便机阅读全文

posted @ 2019-01-14 16:16 Tanglaoer 阅读(720) 评论(0) 推荐(0) 编辑

Tanglaoer

少说废话，直接上代码

公告