上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 49 下一页
摘要: 关于PEP 8 关于Autopep8 下载安装Autopep8 使用Autopep8 Pycharm配置Autopep8方法 回到顶部 关于PEP 8 PEP 8,Style Guide for Python Code,是Python官方推出编码约定,主要是为了保证 Python 编码的风格一致,提 阅读全文
posted @ 2020-12-04 23:54 阿布_alone 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 1、jieba库基本介绍 (1)、jieba库概述 jieba是优秀的中文分词第三方库 -中文文本需要通过分词获得单个的词语 - jieba是优秀的中文分词第三方库,需要额外安装 - jieba库提供三种分词模式,最简单只需掌握一个函数 (2)、jieba分词的原理 Jieba分词依靠中文词库 - 阅读全文
posted @ 2020-12-04 22:28 阿布_alone 阅读(1314) 评论(0) 推荐(0) 编辑
摘要: 一.简介 XML是由万维网联盟(W3C)创建的标记语言,被设计用来传输和存储数据,XML可以自行定义标签,具有自我描述性,其设计宗旨是传输数据,而非显示数据。Python自带XML模块,方便开发者解析XML数据。XML模块中包含了广泛使用的API接口 SAX和DOM等。另外,lxml解析库同样支持H 阅读全文
posted @ 2020-11-29 23:27 阿布_alone 阅读(5657) 评论(0) 推荐(0) 编辑
摘要: 一、常见的中文编码 GB2312编码是在ASCII编码基础上扩展来的,在1980年由中国国家标准总局发布,其中最主要的变化就是引入了简体中文的编码,一共容纳了包括简体中文在内的6000多个字符。 仅仅是简体中文肯定是不够用的,1995年,GBK编码在GB2312编码的基础上进行扩充,加入了繁体中文和 阅读全文
posted @ 2020-11-29 22:53 阿布_alone 阅读(910) 评论(0) 推荐(0) 编辑
摘要: 很多人觉得正则很难,在我看来,这些人一定是没有用心。其实正则很简单,根据二八原则,我们只需要懂 20% 的内容就可以解决 80% 的问题了。我曾经有几年几乎每天都跟正则打交道,刚接手项目的时候我对正则也是一无所知,花半小时百度了一下,然后写了几个 demo,就开始正式接手了。三年多时间,我用到的正则 阅读全文
posted @ 2020-11-29 21:33 阿布_alone 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 我们平时导入第三方模块的时候,一般使用的是import关键字,例如: import scrapy from scrapy.spider import Spider 但是如果各位同学看过 Scrapy 的settings.py文件,就会发现里面会通过字符串的方式来指定 pipeline 和 middl 阅读全文
posted @ 2020-11-29 17:40 阿布_alone 阅读(506) 评论(0) 推荐(0) 编辑
摘要: 我们在使用Redis做消息队列的时候,常常使用列表这个数据结构,并写出如下的代码: import redis import time client = redis.Redis() while True: data = client.lpop('key') if not data: time.slee 阅读全文
posted @ 2020-11-22 22:36 阿布_alone 阅读(402) 评论(0) 推荐(0) 编辑
摘要: 我们在使用 MongoDB 的时候,会出现需要给一个已经存在的大集合的某个字段增加索引的情况。 索引分为前台索引和后台索引,对应到 pymongo 中创建索引的代码: import pymongo handler = pymongo.MongoClient().yourdb.yourcol # 前台 阅读全文
posted @ 2020-11-22 22:01 阿布_alone 阅读(553) 评论(0) 推荐(0) 编辑
摘要: subprocess 模块首先推荐使用的是它的 run 方法,更高级的用法可以直接使用 Popen 接口。 run 方法语法格式如下: subprocess.run(args, *, stdin=None, input=None, stdout=None, stderr=None, capture_ 阅读全文
posted @ 2020-11-17 22:46 阿布_alone 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 今天偷个懒写篇总结性的文章,我们在写爬虫,对网络抓包或逆向一些token参数时常常遇到一长串的字符,看到一长串不知其意义的字符串往往有点懵圈。如果你靠肉眼能从这一长串字符中看出一些特征或含义,那么会加快你写爬虫解析网络参数的步伐,也能给你提供分析思路。 这篇文章就是总结一下常见的字符串编码的格式和特 阅读全文
posted @ 2020-11-01 23:18 阿布_alone 阅读(794) 评论(0) 推荐(0) 编辑
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 49 下一页
TOP