摘要: 本目录主要是记录一些python语言中, 入门之后进阶会遇到的零散知识点。 主要的来源有: "intermediate python" "廖雪峰的python教程" "IBM开源资料社区" "pythontips" 感谢他们的知识共享,我会摘取一些有趣的python知识,并进行一些翻译和组织,分享和 阅读全文
posted @ 2016-11-27 13:47 geek精神 阅读(214) 评论(0) 推荐(0) 编辑
摘要: python特性理解 阅读全文
posted @ 2017-08-16 16:33 geek精神 阅读(517) 评论(0) 推荐(0) 编辑
摘要: 运用三角不等式加速Kmeans聚类算法 引言:最近在刷《数据挖掘导论》,第九章, 9.5.1小节有提到,可以用三角不等式,减少不必要的距离计算,从而达到加速聚类算法的目的。这在超大数据量的情况下,尤为重要。但是书中并没有给出解释和证明。本文以k means聚类算法为代表,讲解下怎么利用三角不等式减少 阅读全文
posted @ 2017-05-11 20:19 geek精神 阅读(3854) 评论(6) 推荐(2) 编辑
摘要: Python时间序列数据分析 以示例说明 标签(空格分隔): 时间序列数据分析 本文的内容主要来源于博客:本人做了适当的注释和补充。 https://www.analyticsvidhya.com/blog/2016/02/time series forecasting codes python/ 阅读全文
posted @ 2017-05-09 21:46 geek精神 阅读(77016) 评论(37) 推荐(7) 编辑
摘要: 什么是 ARIMA模型 ARIMA模型的全称叫做自回归移动平均模型,全称是(ARIMA, Autoregressive Integrated Moving Average Model)。也记作ARIMA(p,d,q),是统计模型(statistic model)中最常见的一种用来进行时间序列 预测的 阅读全文
posted @ 2017-05-08 20:22 geek精神 阅读(150109) 评论(7) 推荐(23) 编辑
摘要: Python进阶 map,filter, reduce是python常用的built in function。 且常与lambda表达式一起用。 其中: map 形式:map(function_to_apply, list_of_inputs) list 作用:map的作用是将一个序列的元素(通常是 阅读全文
posted @ 2016-11-28 16:09 geek精神 阅读(660) 评论(0) 推荐(1) 编辑
摘要: 标签(空格分隔): Python进阶 Lambda是一种匿名函数,当我们需要重复调用某一函数,又不想写那么多代码时可以使用lambda表达式来代替。 lambda的通用格式: lambda argument: manipulate(argument) 示例代码: 用法:排序. 阅读全文
posted @ 2016-11-28 16:07 geek精神 阅读(537) 评论(0) 推荐(0) 编辑
摘要: 容器类Collections 标签(空格分隔): Python进阶 1. defaultdict 2. counter 3. deque 4. namedtuple defaultdict defaultdict的作用是可以不用检查key是否存在,如果不存在可以直接创建。 而不像dict,会rais 阅读全文
posted @ 2016-11-28 15:10 geek精神 阅读(492) 评论(0) 推荐(1) 编辑
摘要: 在context manager中,必须要介绍两个概念: with as... , 和 __enter__ , __exit__. 下文将先介绍with语句,然后介绍 __enter__和__exit__, 最后介绍context manager. with语句的作用 它的好处是自动运行try fi 阅读全文
posted @ 2016-11-28 14:31 geek精神 阅读(542) 评论(0) 推荐(0) 编辑
摘要: Python之协程(coroutine) 标签(空格分隔): Python进阶 coroutine和generator的区别 generator是数据的产生者。即它pull data 通过 iteration coroutine是数据的消费者。它push data into pipeline 通过 阅读全文
posted @ 2016-11-27 15:46 geek精神 阅读(13728) 评论(0) 推荐(1) 编辑
摘要: 标签(空格分隔): Python进阶 python中,由于创建每个实例都会有成员,这些成员都会被保存在dict中,但是Python不能静态分配RAM,当创建实例时,因此dict的大小会比所需要的内存大,特别是当实例数量有成千上万个时,造成RAM的浪费。 在此背景下,引入 帮助节省RAM。 是一个在c 阅读全文
posted @ 2016-11-27 13:53 geek精神 阅读(332) 评论(0) 推荐(0) 编辑