摘要: 多线程共享全局变量的问题: 多线程就是在同个进程中运行的。因此在进程中的全局变量所有线程都可共享。这就造成了一个问题,因为线程执行过程的顺序是无序的,导致有可能造成数据错误: 这时候就需要加上一把锁,把先进到该进程上锁,即不会让别的线程进入,防止乱序,导致数据出错。特别是当数据特别大时,就容易出错。 阅读全文
posted @ 2019-09-08 09:54 hey朱迪 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 1.多线程: 多线程是为了同步完成多项任务,不是为了提高运行效率,而是为了提高资源使用效率来提高系统的效率。线程是在同一时间需要完成多项任务的时候实现的。 最简单的比喻多线程就像火车的每一节车厢,而进程则是火车。车厢离开火车是无法跑动的,同理火车也不可能只有一节车厢。多线程的出现就是为了提高效率。同 阅读全文
posted @ 2019-08-02 23:57 hey朱迪 阅读(316) 评论(0) 推荐(0) 编辑
摘要: 连接MySQL代码如下: 插入数据: 1) 2) 很多时候,需要插入的值不是固定的,而是个变量,所以我们可以使用这个方法插入数据。 阅读全文
posted @ 2019-07-29 23:34 hey朱迪 阅读(9499) 评论(1) 推荐(0) 编辑
摘要: csv文件的读取: 1)通过列表下标读取: 直接用 open() 函数打开 csv 文件。使用csv.reader() 方法,其中参数为指针。因为该 csv 文件有表头,使用可以使用 next() 函数直接跳过第一组数据,即表头数据。然后直接通过列表下标获取想要的数据。 2)通过key获取: 使用D 阅读全文
posted @ 2019-07-27 23:05 hey朱迪 阅读(8561) 评论(0) 推荐(1) 编辑
摘要: 1.json字符串的基本介绍: 1)JSON的定义: JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式。它基于 ECMAScript (欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰 阅读全文
posted @ 2019-07-19 16:27 hey朱迪 阅读(2026) 评论(0) 推荐(0) 编辑
摘要: 1.观察url: 明显观察出url规律:https://www.qiushibaike.com/text/page/X/ 其中X是按页码顺序依次变化的。即1,2,3......。 2.主函数的编写: 其中 parse_page() 是页面解析函数。以上代码可以实现爬取1-10页的段子。 3.页面解析 阅读全文
posted @ 2019-07-17 20:18 hey朱迪 阅读(285) 评论(0) 推荐(0) 编辑
摘要: match函数: 从开始位置进行匹配,如果开始位置没有匹配到,就直接失败。 search函数: 在字符串中找满足条件的字符,如果找到,就返回。说白了,就是只会找到第一个满足条件的。 匹配结果是 h,而不会出现两个 hh。 findall函数: 找出所有满足条件的字符,返回的是一个列表。 匹配结果:[ 阅读全文
posted @ 2019-07-16 23:44 hey朱迪 阅读(673) 评论(0) 推荐(0) 编辑
摘要: 多个字符的匹配: 1)*:可以匹配0个或者任意多个字符 匹配出来的结果为 09,其中可以匹配0个的意思是:当匹配的字符串中没有匹配内容,不会抛出错误,会显示空。 2)+:匹配一个或者多个字符 当匹配不出,即匹配出0个时会报错。 3)?:匹配到一个或者0个(要么没有要么只有一个) 4){m}:匹配m个 阅读全文
posted @ 2019-07-15 15:30 hey朱迪 阅读(547) 评论(0) 推荐(0) 编辑
摘要: 什么是正则表达式: 个人对其的理解:按照一定规则,从某个字符串中匹配出想要的数据。 标准的解释:正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文 阅读全文
posted @ 2019-07-14 13:31 hey朱迪 阅读(668) 评论(0) 推荐(0) 编辑