上一页 1 2 3 4 5 6 7 8 ··· 10 下一页
摘要: 连接数据库 插入数据 insert_one(), 一次插入一条记录 insert_many(), 一次插入多条记录 mongo默认会给每一条记录添加一个_id字段,用来唯一标识每一条记录。 可以使用 和`result.inserted_ids`来查看插入记录的_id编号。 查询数据 find_one 阅读全文
posted @ 2017-10-09 20:14 cnkai 阅读(2651) 评论(0) 推荐(0) 编辑
摘要: 停止子线程 如果一切正常,那么上面的例子很完美。可是,需要停止程序,直接ctrl+c,会抛出KeyboardInterrupt错误,我们修改一下主循环: 可是实际上并不好使,虽然主线程try了KeyboardInterrupt异常,但是子线程并没有退出,为了解决这个问题,可以设置子线程为守护线程,这 阅读全文
posted @ 2017-10-09 20:13 cnkai 阅读(444) 评论(0) 推荐(0) 编辑
摘要: time模块 datetime模块 阅读全文
posted @ 2017-10-09 20:13 cnkai 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 几个概念: event_loop 事件循环:程序开启一个无限的循环,程序员会把一些函数注册到事件循环上。当满足事件发生的时候,调用相应的协程函数。 coroutine 协程:协程对象,指一个使用async关键字定义的函数,它的调用不会立即执行函数,而是会返回一个协程对象。协程对象需要注册到事件循环, 阅读全文
posted @ 2017-10-09 20:12 cnkai 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 协程嵌套 使用async可以定义协程,协程用于耗时的io操作,我们也可以封装更多的io操作过程,这样就实现了嵌套的协程,即一个协程中await了另外一个协程,如此连接起来。 如果使用的是 asyncio.gather创建协程对象,那么await的返回值就是协程运行的结果。 不在main协程函数里处理 阅读全文
posted @ 2017-10-09 20:12 cnkai 阅读(414) 评论(0) 推荐(0) 编辑
摘要: 冒泡排序 算法思想: 对于一组需要排序的数据,对于相邻的两个数进行比较,使较大(或者较小)的数一直向后推,经过多层排序之后,使整个序列是有序的。 算法实现: 算法的实现使用了两层for循环,其中对于外层for循环来说,第一次for循环,最大的数被推到最后面,第二次for循环,次大的数被推到次后面.. 阅读全文
posted @ 2017-10-09 20:11 cnkai 阅读(367) 评论(0) 推荐(0) 编辑
摘要: 发起请求 添加请求参数 自定义User Agent 自定义cookies post字符串 post文件 设置代理 设置认证代理 阅读全文
posted @ 2017-10-09 20:11 cnkai 阅读(592) 评论(0) 推荐(0) 编辑
摘要: 临近毕业,租房是少不了的,为了直观的了解江苏省的租房价格信息,这次就从58同城抓取了江苏省13个市的租房信息,进行简单地分析。 本次获得信息一共是3万条左右,抓取到的原始信息会附在文末,用到的主要的分析工具是pandas。 首先来看一下我们的原始信息的样子。 首先将‘name’字段进行分割,提取出租 阅读全文
posted @ 2017-10-09 14:05 cnkai 阅读(1298) 评论(0) 推荐(0) 编辑
摘要: ![](http://images2017.cnblogs.com/blog/1203446/201710/1203446-20171006134317161-546127183.png) ![](http://images2017.cnblogs.com/blog/1203446/201710/1203446-20171006134404396-682153809.png) ![](http... 阅读全文
posted @ 2017-10-06 13:48 cnkai 阅读(591) 评论(0) 推荐(0) 编辑
摘要: 相对于知乎而言,简书的用户信息并没有那么详细,知乎提供了包括学习,工作等在内的一系列用户信息接口,但是简书就没有那么慷慨了。但是即便如此,我们也试图抓取一些基本信息,进行简单地细分析,至少可以看一下,哪些人哪一类文章最受用户欢迎,也可以给其他人一些参考不是。 我们整体的思路是这样的: 从某一个大V开 阅读全文
posted @ 2017-09-27 21:42 cnkai 阅读(1198) 评论(0) 推荐(1) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 10 下一页