上一页 1 ··· 4 5 6 7 8 9 10 11 12 13 下一页
摘要: 本文旨在介绍R语言中ggplot2包的一些精细化操作,主要适用于对R画图有一定了解,需要更精细化作图的人,尤其是那些刚从excel转ggplot2的各位,有比较频繁的作图需求的人。不讨论那些样式非常酷炫的图表,以实用的商业化图表为主。包括以下结构: 1、画图前的准备:自定义ggplot2格式刷 2、 阅读全文
posted @ 2016-04-20 19:02 payton数据之旅 阅读(855) 评论(0) 推荐(0) 编辑
摘要: #####开一个新的系列。关于R的一些笔记,就是遇到过的一些问题的简单整理。可能很基本,也可能没什么大的用处,作为一个记录而已。 R笔记(1):formula和Formula1.基本的R公式对象formula在R当中,公式fomula是一个把响应变量(在~左侧)和解释变量(在~右侧)联系起来的对象。 阅读全文
posted @ 2016-04-20 13:50 payton数据之旅 阅读(1331) 评论(0) 推荐(0) 编辑
摘要: 近年来,深度学习可谓是机器学习方向的明星概念,不同的模型分别在图像处理与自然语言处理等任务中取得了前所未有的好成绩。在实际的应用中,大家除了关心模型的准确度,还常常希望能比较快速地完成模型的训练。一个常用的加速手段便是将模型放在GPU上进行训练。然而由于种种原因,R语言似乎缺少一个能够在GPU上训练 阅读全文
posted @ 2016-04-18 12:38 payton数据之旅 阅读(2773) 评论(0) 推荐(0) 编辑
摘要: COS论坛里面经常会遇到的一个问题就是绘图时中文字体怎么解决。最初,一个流行的方法是使用family = "GB1",但一般这样做出来的图比较难看,而且并没有完全解决问题。后来发现了Cairo包,喜大普奔,但后来又发现它选字体的时候不太明确,也就是说我不知道怎样才能选中我想要的那个字体。再然后,Wi 阅读全文
posted @ 2016-04-14 16:53 payton数据之旅 阅读(1552) 评论(0) 推荐(0) 编辑
摘要: 前言 R语言不仅在统计分析,数据挖掘领域,计算能力强大。在数据可视化上,也不逊于昂贵的商业。当然,背后离不开各种开源软件包的支持,Cairo就是这样一个用于矢量图形处理的类库。 Cairo可以创建高质量的矢量图形(PDF, PostScript, SVG) 和 位图(PNG, JPEG, TIFF) 阅读全文
posted @ 2016-04-14 16:40 payton数据之旅 阅读(6811) 评论(0) 推荐(0) 编辑
摘要: 前言 经常用R处理数据的分析师都会对dplyr包情有独钟,它强大的数据整理功能让原始数据从杂乱无章到有序清晰,便于后期进一步的深入分析,特别是配合上数据库的使用,更是让分析师如虎添翼,轻松搞定Excel难以驾驭的数据容量,下面我们通过一个实用案例来具体看看如何将R和数据库完美融合在一起。在以后的博客 阅读全文
posted @ 2016-04-07 16:08 payton数据之旅 阅读(1085) 评论(0) 推荐(0) 编辑
摘要: data.table包主要特色是:设置keys、快速分组和滚得时序的快速合并。data.table主要通过二元检索法大大提高数据操作的效率,同时它也兼容适用于data.frame的向量检索法。 1.创建data.table格式数据 类似于data.frame数据的创建,使用data.table函数 阅读全文
posted @ 2016-04-07 15:20 payton数据之旅 阅读(520) 评论(0) 推荐(0) 编辑
摘要: Courses上台湾大学林轩田老师的机器学习技法课之Aggregation 模型学习笔记。 混合(blending) 本笔记是Course上台湾大学林轩田老师的《机器学习技法课》的学习笔记,用于学习之后的一些总结。 首先,对于Aggregation模型,其基本思想就是使用不同的 g t 来合成最后的 阅读全文
posted @ 2016-03-31 23:51 payton数据之旅 阅读(810) 评论(0) 推荐(0) 编辑
摘要: Prepare the data 数据来自UCIhttp://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening,一个信a用卡的数据,具体各项变量名以及变量名代表的含义不明(应该是出于保护隐私的目的),本文会用logi 阅读全文
posted @ 2016-03-31 11:38 payton数据之旅 阅读(9410) 评论(0) 推荐(0) 编辑
摘要: 通常来说,我们可以从两个方面来提高一个预测模型的准确性:完善特征工程(feature engineering)或是直接使用Boosting算法。通过大量数据科学竞赛的试炼,我们可以发现人们更钟爱于Boosting算法,这是因为和其他方法相比,它在产生类似的结果时往往更加节约时间。 Boosting算 阅读全文
posted @ 2016-03-30 00:56 payton数据之旅 阅读(1383) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 13 下一页