司空格子Ored

2015年12月6日

《利用python进行数据分析》读书笔记--第七章数据规整化：清理、转换、合并、重塑（一）

摘要：数据分析和建模的大量编程工作都是在数据准备上的（深表同意）：加载、清理、转换以及重塑。pandas和Python标准库提供了一组高级的、灵活的、高效的核心函数和算法，他们能够轻松地将数据规整化为正确的形式。1、合并数据集pandas对象中的数据可以通过一些内置的方式进行合并pandas.merge可... 阅读全文

posted @ 2015-12-06 12:22 司空格子Ored 阅读(2020) 评论(0) 推荐(0)

2015年12月5日

《利用python进行数据分析》读书笔记--第六章数据加载、存储与文件格式

摘要：输入输出一般分为下面几类：读取文本文件和其他更高效的磁盘存储格式，加载数据库中的数据。利用Web API操作网络资源。1、读写文本格式的数据自己感觉读写文件有时候“需要运气”，经常需要手工调整。因为其简单的文件交互语法、直观的数据结构，以及诸如元组打包解包之类的便利功能，Python在文本和文件处理... 阅读全文

posted @ 2015-12-05 16:58 司空格子Ored 阅读(7399) 评论(0) 推荐(0)

2015年12月2日

《算法导论》读书笔记--第三章函数的增长课后题

摘要：本章的课后题看一下即可，比较平凡。 3.1渐近记号引用一下别人的答案，非常感谢：原文地址：http://www.cnblogs.com/timebug/archive/2010/03/25/1694286.html |概念回顾| 当输入规模大到使只有运行时间的增长量级有关时，就使在研究算法的渐进效率。几个重要渐进记号的定义： Θ(g(n))={ f(n): 存在正常数c1,c2和n0，使对... 阅读全文

posted @ 2015-12-02 00:35 司空格子Ored 阅读(1980) 评论(0) 推荐(0)

2015年11月30日

《利用python进行数据分析》读书笔记--第五章 pandas入门

摘要： pandas是本书后续内容的首选库。pandas可以满足以下需求：具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源（索引方式不同）的数据而导致的常见错误。. 集成时间序列功能既能处理时间序列数据也能处理非时间序列数据的数据结构数学运算和简约（比如对某个轴求和）可以根据不同的元数据（轴编号）执行灵活处理缺失数据合并及其他出现在常见数据库... 阅读全文

posted @ 2015-11-30 09:17 司空格子Ored 阅读(67645) 评论(4) 推荐(5)

2015年11月27日

《利用python进行数据分析》读书笔记--第四章 numpy基础：数组和矢量计算

摘要：第四章 Numpy基础：数组和矢量计算第一部分：numpy的ndarray:一种多维数组对象实话说，用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能，理解Numpy和面向数组的计算能有助于理解后面的pandas.按照课本的说法，作者关心的功能主要集中于：用于数据整理和... 阅读全文

posted @ 2015-11-27 11:24 司空格子Ored 阅读(4330) 评论(0) 推荐(0)

《利用python进行数据分析》读书笔记--第三章 ipython使用

摘要：暂略。阅读全文

posted @ 2015-11-27 10:09 司空格子Ored 阅读(1071) 评论(0) 推荐(0)

2015年11月23日

《算法导论》读书笔记--第三章函数的增长

摘要：好长时间了，继续算法导论。当输入规模足够大时，并不计算精确的运行时间，倍增常量和低阶项被舍去。我们要研究的是算法的渐近效率，即在输入规模无限量时，在极限中，算法的运行时间如何随着输入规模的变大而增加。通常，渐近的更有效的某个算法除对很小得到输入外都是最好的选择。3.1渐近符号用渐近符号来刻画算法的运... 阅读全文

posted @ 2015-11-23 00:38 司空格子Ored 阅读(611) 评论(0) 推荐(0)

2015年10月10日

《利用python进行数据分析》读书笔记 --第一、二章准备与例子

摘要：第一章准备工作今天开始码这本书--《利用python进行数据分析》。R和python都得会用才行，这是码这本书的原因。首先按照书上说的进行安装，google下载了epd_free-7.3-1-win-x86.msi，译者建议按照作者的版本安装,EPDFree包括了Numpy,Scipy,matp 阅读全文

posted @ 2015-10-10 21:23 司空格子Ored 阅读(9644) 评论(9) 推荐(4)

2015年9月23日

《R语言实战》读书笔记--学习张丹日志

摘要：从张丹的日志（http://blog.fens.me/rhadoop-r-basic/）中第九条对象看到R对象的几个总结：1、内在属性mode length 所有对象都有的属性2、外部属性attributes（）函数可以查看外部属性；attr（x,“a”） a b f outer(a,b,f... 阅读全文

posted @ 2015-09-23 10:10 司空格子Ored 阅读(756) 评论(0) 推荐(0)

2015年8月22日

《R语言实战》读书笔记第七章--基本统计分析

摘要：在导入数据并且将数据进行组织和初步可视化以后，需要对数据进行分布探索和两两关系分析等。主要内容有描述性统计分析、频数表和列联表、相关系数和协方差、t检验、非参数统计。7.1描述性统计分析7.1.1方法云集书上说，R中的描述性统计量函数“多的尴尬”。summary函数返回最大值、最小值、上下四分位数、... 阅读全文

posted @ 2015-08-22 17:08 司空格子Ored 阅读(2382) 评论(0) 推荐(0)

我们的前方是星辰大海

公告