文章分类 -  R

R语言-缺失值处理1
摘要:R语言中缺失值处理 前言   在处理数据的过程中,样本往往会包含缺失值。我们有必要对缺失值进行处理,这样不但可以降低预测分析的数据偏差,而且还可以构建有效的模型。本文将简要介绍几种常见的数据缺失值处理方法。 目录  1. 数据准备和模式设定  2. 删除记录 阅读全文

posted @ 2016-05-19 11:42 银河统计 阅读(16891) 评论(0) 推荐(2) 编辑

R语言-字符串处理包stringr
摘要:R语言字符串处理包stringr 前言   用R语言处理字符串,总觉得很麻烦,即不能用向量的方法进行分割,也不能用循环遍历索引。grep()家族函数常常记不住,paste()函数默认以空格分割,各种不顺手啊!随着使用R语言的场景越来越多,字符串处理是必不可少的。给大家推荐一个由 阅读全文

posted @ 2016-05-18 11:30 银河统计 阅读(2705) 评论(0) 推荐(0) 编辑

R语言-正则表达式
摘要:R语言中正则表达式 内容概览   有时候我们要处理的是非结构化的数据,例如网页或是电邮资料,那么就需要用R来抓取所需的字符串,整理为进一步处理的数据形式。R语言中有一整套可以用来处理字符的函数,在之前的 博文 中已经有所涉及。但真正的要用好字符处理函数,则不得不用到正则表达式。 阅读全文

posted @ 2016-05-17 21:33 银河统计 阅读(2774) 评论(0) 推荐(0) 编辑

R语言-字符串处理函数
摘要:R语言中的字符串处理函数 内容概览   尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串有时候也会在数据分析中占到相当大的份量。   R语言是一个擅长处理数据的语言,但是也不可避免的需要处理一些字符串(文本数据)。如何高效地处理文本数据,将看似杂乱无章的 阅读全文

posted @ 2016-05-15 18:40 银河统计 阅读(2773) 评论(0) 推荐(0) 编辑

R语言-程序异常或错误处理
摘要:R语言异常或错误处理   问题1:在使用R语言(RCurl包)抓取网页的过程中,往往会因为有些页面超时,或者页面不存在而导致程序因为异常中断退出,进而使自动批量抓取数据的程序中断,这时就需要有人工干预,重新运行程序或重新启动服务,从而导致维护成本增加。   问 阅读全文

posted @ 2016-05-14 10:48 银河统计 阅读(11572) 评论(0) 推荐(2) 编辑

R语言-内存管理
摘要:R语言内存管理 "R之内存管理" 转载 引言   R的内存管理机制究竟是什么样子的?最近几日在讲一个分享会,被同学问到这方面的问题,可是到网上去查,终于找到一篇 "R语言内存管理" 不过讲的不清不楚的,就拿memory.limit()函数来说,是在windows下才使用的,作者几 阅读全文

posted @ 2016-05-10 16:25 银河统计 阅读(7001) 评论(0) 推荐(1) 编辑

R语言-环境变量设置
摘要:R语言环境变量的设置 环境设置函数为options(),用options()命令可以设置一些环境变量,使用help(options)可以查看详细的参数信息。 1. 数字位数的设置,options(digits=n),n一般默认情况下是7位,但实际上的范围是1~22,可以随意设置位数。 这个命令,可以 阅读全文

posted @ 2016-05-07 10:48 银河统计 阅读(13544) 评论(0) 推荐(0) 编辑

R语言-时间日期函数
摘要:R语言时间日期函数 1. 返回当前日期时间,有两种方式: Sys.time() date() 举例 format(Sys.time(), "%a %b %d %X %Y %Z") [1] "周五 五月 06 14:17:40 2016 CST" format(Sys.time(), "%H:%M:% 阅读全文

posted @ 2016-05-06 15:40 银河统计 阅读(8106) 评论(0) 推荐(0) 编辑

R语言-自动批处理
摘要:R语言 自动批处理文件   在处理数据的过程中,可以制作一个自动批处理文件,让它具有智能的效果,自动化完成复杂的数据处理过程,提高工作效率,解放生产力,从而可以投入更多的精力到数据分析和数据挖掘中,发现数据中的"金子",体现数据的真正价值!!! 方法1:    阅读全文

posted @ 2016-05-05 13:43 银河统计 阅读(9167) 评论(0) 推荐(0) 编辑

R语言-包的一些操作命令
摘要:R包的安装路径相关 R官网相关 https://www.r project.org/ https://cran.r project.org/ https://r forge.r project.org/R/?group_id=156 https://cran.rstudio.com/src/cont 阅读全文

posted @ 2016-05-04 22:33 银河统计 阅读(8004) 评论(0) 推荐(1) 编辑

R语言-实用功能性语句1
摘要:  R常用语句汇总整理,方便查找调用!!! 目录概览   1) R支持自动补全(Tab|键|命令)   2) 清除单个变量使用rm()函数   3) 清除内存中所用的变量   4) 更改小数点后显示数字位数   5) R工作目录的 阅读全文

posted @ 2016-05-03 14:31 银河统计 阅读(2386) 评论(0) 推荐(0) 编辑

R函数-数学和统计
摘要:数学和统计###################计算#################四则运算+, -, *, /, ^, %%, %/%#舍入ceiling,floor,round,signif,trunc,zapsmall#最大最小值max,min,pmax,pmin#最大值和最小值range#... 阅读全文

posted @ 2016-01-26 16:33 银河统计 阅读(604) 评论(0) 推荐(0) 编辑

R函数-逻辑运算
摘要:逻辑运算#比较运算符,=,==,!=#逻辑运算符!,&,&&,|,||,xor()#生成逻辑向量logical#逻辑向量都为真或存在真all,any#二者择一 ifelse()#查找match,%in%#找到真值下标集合which#找到重复元素duplicated#找出互不相同的元素unique 阅读全文

posted @ 2016-01-26 00:01 银河统计 阅读(299) 评论(0) 推荐(0) 编辑

R函数-数组和矩阵
摘要:数组和矩阵#建立数组array#生成矩阵matrix#把数据框转换为数值型矩阵data.matrix#矩阵的下三角部分lower.tri#生成矩阵或向量mat.or.vec#矩阵转置t#把列合并为矩阵cbind#把行合并为矩阵rbind#矩阵对角元素向量或生成对角矩阵diag#数组转置aperm#计... 阅读全文

posted @ 2016-01-25 23:54 银河统计 阅读(312) 评论(0) 推荐(0) 编辑

R函数-字符串操作
摘要:字符串操作#++++++++++++++++++++++++++++++++++++++++++#++++++++++++++++++++++++++++++++++++++++++#R语言+++++++++字符串处理函数+++++++++#内容概览:#尽管R是一门数值向量和矩阵为核心的统计语言,但... 阅读全文

posted @ 2016-01-25 23:39 银河统计 阅读(368) 评论(0) 推荐(0) 编辑

R函数-数据管理
摘要:数据管理#向量 vector#数值型向量 numeric#逻辑型向量logical#字符型向量character#列表list #数据框data.frame#连接为向量或列表c#因子factor#因子的编码 codes#因子的各水平的名字levels#因子的水平个数nlevels#把数值型对象分区间... 阅读全文

posted @ 2016-01-25 23:37 银河统计 阅读(287) 评论(0) 推荐(0) 编辑

R语言相关数据集
摘要:如何使用R内置的数据集 R在datasets包中提供了100多个可以使用的数据集|通过data()函数加载入内存 data() dim(data()$results) data()$results data()$results[,4] 向量 rivers 北美141条河流... 阅读全文

posted @ 2016-01-24 23:49 银河统计 阅读(4501) 评论(0) 推荐(0) 编辑

R语言学习
摘要:学习 R 的方法 知识和耐心,是成为强者的唯一方法。 通过阅读来学习。 包括了阅读经典的教材、代码、论文、学习公开课。 通过牛人来学习。 包括同行的聚会、讨论、大牛的博客、微博、twitter、RSS。 通过练习来学习。 包括代码练习题、参加kaggle比赛、解决实际工作中的难题。 通过分享来学习。 阅读全文

posted @ 2016-01-21 16:52 银河统计 阅读(893) 评论(0) 推荐(0) 编辑