摘要:
· 掌握定向网络数据爬取和网页解析的基本能力 · The Website is the API… (Application Programming Interface,应用程序编程接口) - Requests:自动爬取HTML页面,自动网络请求提交 - robots.txt:网络爬虫排除标准 - B 阅读全文
摘要:
发布报告: Knit to HTML => Publish => 注册账户 => 编辑文章名等 => 发布 请检查: · Do - 研究一个有意思 / 有意义的问题 - 教会电脑做事(能自动化就自动化) - 使用版本控制(GitHub) - 注明软件环境 - 设置seed - 保持全局性,知道处于整 阅读全文
摘要:
1. 可重复研究 和 可再生研究(Replication vs. Reproducible Research) 1.1 Replication(可重复) - 独立的研究者 / 数据 / 分析方法 / 工具得到一致的证据 · 小保方晴子 · 具身认知(embodied cognition) - 缺点: 阅读全文
摘要:
目的: - 了解数据特征、找到数据中的模式、形成分析策略 - 图与数字互相验证、帮助发现错误、用于交流结果 特点: - 快速、通常呈现在屏幕设备 - 不需要过分注重图是否漂亮 - 请注重六大作图原则 分析性作图的六大原则: 1. 凸显比较(谁和谁比?) 2. 凸显机制(因果 / 机制 / 解释) 3 阅读全文
摘要:
6. R 语言支持的图形设备 · 什么是图形设备 - 屏幕设备(探索性分析常用):电脑屏幕 · windows() on Windows / quartz() on Mac / xll() on Unix or Linux - 文件设备(打印/文章用图常用) · 向量格式(vector format 阅读全文
摘要:
5. R语言绘图之 颜色 · grDevice 包 - colorRamp() 和 colorRampPalette() - 颜色名字可使用 colors() 获取 · RColorBrewer 包 - 三类调色板: 1. sequential:从一个极端渐变到另一个极端,适合用于呈现顺序数据 2. 阅读全文
摘要:
使用ggplot2绘图的本质,是把数据映射到几何客体的美学属性上。 1. 层(layer) 2. 绘图函数 - qplot() · 类似于Base系统的plot(), 参数包含 aesthetics / geom / facet ... · 隐藏了绘图实现的细节 - ggplot() · 是核心, 阅读全文
摘要:
1. 绘图函数: - lattice 包: · xyplot / bwplot / histogram / stripplot / dotplot / splom / levelplot / contourplot · 格式:xyplot ( y ~ x | f * g , data ) · pan 阅读全文
摘要:
1. 绘图函数(graphics 包) - plot / hist / boxplot / points / lines / text / title / axis - 调用函数会启用一个图形设备并在设备上绘图 · 基本绘图系统 + 屏幕设备 2. plot() - plot(x, y, ...) 阅读全文
摘要:
1. R的三大绘图系统简介 1.1 基本绘图系统(Base Plotting System) - 艺术家的调色板:绘图适于空白帆布 · 需要实现计划;直观地实时反映绘图和分析数据的逻辑 - 两步 = 图 + 修饰/添加 = 执行一系列函数 - 适于绘制2D图 1.2 Lattice 绘图系统(Lat 阅读全文