摘要: python爬虫之数据分析包pandas 一.pandas介绍 pandas 是基于numpy构建的含有更高级数据结构和工具的数据分析包 类似于numpy的核心是ndarray,pandas也是围绕这series和datafrom > 两个核心数据结构 pandas的引入方式 1.安装方式 pip3 阅读全文
posted @ 2019-09-19 15:43 丶小白吖 阅读(545) 评论(0) 推荐(0) 编辑
摘要: pandas生成时间列表 1.根据始末时间生成一个时间段 pd.date_range(start, end, freq) freq**参数由英文(M D H Min 。。。)、英文数字结合。D表示一天,M表示一月如20D表示20天,5M表示5个月。 #生成20171011-20171030 pd.d 阅读全文
posted @ 2019-08-05 14:10 丶小白吖 阅读(3228) 评论(0) 推荐(0) 编辑
摘要: 一丶pandas分组处理数据 # 原生sql sql_other = 'SELECT StartTime, Status, ResultNum, EndTime FROM `Record_{username}` where ' \ 'unix_timestamp(StartTime) > unix_ 阅读全文
posted @ 2019-08-05 13:56 丶小白吖 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 1.什么是Celery Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统 专注于实时处理的异步任务队列 同时也支持任务调度 2.Celery架构 Celery的架构由三部分组成,消息中间件(message broker),任务执行单元(worker)和任务执行结果存储(task res 阅读全文
posted @ 2019-08-05 13:52 丶小白吖 阅读(434) 评论(1) 推荐(0) 编辑