摘要: pickle cpicle c语言写的 快 功能上是一样的 阅读全文
posted @ 2018-07-05 21:41 duxiao123 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 搜索引擎和网站都在采集大量信息 非原创即采集 采集信息的程序一般被称为网络爬虫(web crawler) 网络铲 web scraper 类比考古用的洛阳铲 网络蜘蛛web spider 一般爬到 对应网页上 再把需要的信息 铲 下来 言词证据 在不断变化 阅读全文
posted @ 2018-07-05 21:19 duxiao123 阅读(97) 评论(0) 推荐(0) 编辑
摘要: http://www.itdiffer.com http://www.1world0x00.com 阅读全文
posted @ 2018-07-05 21:06 duxiao123 阅读(1561) 评论(0) 推荐(0) 编辑
摘要: 从github或者其他地方下载zip tar.zip tar.bz2 的压缩文件 解压缩 进入目录 或者git clone python setup.py install 具体位置 视操作系统和你当初安装Python环境时候设置的路径 而定 Lib/Site-packages 直接找到库文件的位置 阅读全文
posted @ 2018-07-05 18:47 duxiao123 阅读(142) 评论(0) 推荐(0) 编辑
摘要: urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None) Open the URL url, which can be either a 阅读全文
posted @ 2018-07-05 09:18 duxiao123 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 首先说 正则表达式是什么? 正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编 阅读全文
posted @ 2018-07-05 08:56 duxiao123 阅读(171) 评论(0) 推荐(0) 编辑
摘要: python 3中最重要的新特性可能就是将文本(text)和二进制数据做了更清晰的区分。文本总是用unicode进行编码,以str类型表示;而二进制数据以bytes类型表示。 在python3中,不能以任何隐式方式将str和bytes类型二者混合使用。不可以将str和bytes类型进行拼接,不能在s 阅读全文
posted @ 2018-07-05 08:07 duxiao123 阅读(310) 评论(0) 推荐(0) 编辑