摘要:
1 Anaconda Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas、matplotlib等。Conda是一个开源的包、环境管理器(相当于centos里面的yum),可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换。 阅读全文
摘要:
数据可视化 基本概念 数据可视化是指借助于图形化的手段,清晰、快捷有效的传达与沟通信息。同时,也可以辅助用户做出相应的判断,更好的去洞悉数据背后的价值。 字不如表,表不如图。 观察号码的频率,每个号码出现了多少次? 文字 08 10 15 20 30 31 33 0601 09 10 17 21 2 阅读全文
摘要:
#数据处理 ##数据加载 首先,我们需要将收集的数据加载到内存中,才能进行进一步的操作。pandas提供了非常多的读取数据的函数,分别应用在各种数据源环境中,我们常用的函数为: read_csv, read_table, read_sql, 说明: read_csv与read_table默认使用的分 阅读全文
摘要:
#概述 ##numpy numpy(numeric python)是 python 的一个开源数值计算库,主要用于数组和矩阵计算。底层是 C 语言,运行效率远高于纯 python 代码。numpy主要包含2个重要的数据类型: 1)ndarray (N维数组,这个是我们要重点掌握的) 2)matrix 阅读全文