摘要:
可视化工具 PowerBI, Tableau, RAWGraphs RShiny,Dimple D3, EChats,Highcharts 可视化工具金字塔 最关键的还是可视化背后关于数据的故事 可视化准则 Gestalt 格式塔 详细说明 人眼扫视规律 通过技术来追踪人眼实际扫视的规律 人眼注意力 阅读全文
摘要:
Python Basics 归根到底,计算机能做的事: 迅速进行计算(需要有好的算法) 存储数据 计算机的局限: 无法解决很复杂的问题 一些不能通过计算来解决的问题 计算机可识别的信息: 陈述性的信息(declarative knowledge):是什么 命令性的信息(imperative know 阅读全文
摘要:
Module 2 Data Wrangling 处理缺失值 数据格式化 数据标准化 数据分组 数据转换CategoricalNumeric Module 3 Exploratory Data AnalysisEDA 统计描述 Groupby in Python 方差分析ANOVA 相关分析corre 阅读全文
摘要:
ggplot2包中的颜色使用 载入数据 基本绘图 将变量的值映射到颜色 对色盲友好的调色板 色卡 The RColorBrewer package Sequential palettes Qualitative palettes Diverging palettes ggplot2包中的颜色使用 文 阅读全文
摘要:
原文链接,作者:Stephen Few。 我们关心的是颜色的实际使用方法,而不是艺术性的表达,需要熟悉几条关于颜色使用的基本规则。 上下文中的颜色 首先从一个关于高效使用颜色需要理解的重要事实开始。我们对颜色并没有绝对的感知,我们对事物的感知会收受到周围环境的影响。视觉感知是相对的,从一个灰色小方块 阅读全文
摘要:
原文链接,作者:Stephen Few。 定量和分类数据 编码定量信息 点 线 长条 数据的7种基本类型 定量和分类数据 简单来说,分类数据告诉我们是什么,而定量数据告诉我们有多少,定量数据如果缺少相关的分类数据,将会毫无用处。 一个图表中可能包含不止一种分类数据,比如下图中包含两套分类数据,时间和 阅读全文
摘要:
记录一些R Markdown中与一般的Markdown不同的用法。 1.代码块设置 echo=FALSE最终的文档中不会显示代码,只会显示代码运行的结果和图像 results="hide"隐藏结果,显示图像 include=FALSE隐藏代码和运行的输出(写报告时可使用include=FALSE来隐 阅读全文
摘要:
参考来源菜鸟教程 Python find()方法 Python find() 方法检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,如果包含子字符串返回开始的索引值,否则返回-1。 语法: str.find(str, beg=0, 阅读全文
摘要:
文章来源:http://blog.csdn.net/lawme/article/details/51034543 Jupyter Notebook 的快捷键 Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程 阅读全文
摘要:
11 测试代码 编写函数或类时,还可为其编写测试。通过测试,可确定代码面对各种输入都能够按要求的那样工作。在程序中添加新代码时,你也可以对其进行测试,确认它们不会破坏程序既有的行为。 在本章中,你将学习如何使用Python模块unittest中的工具来测试代码。你将学习编写测试用例,核实一系列输入都 阅读全文