摘要: 尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串有时候也会在数据分析中占到相当大的份量。 R语言是一个擅长处理数据的语言,但是也不可避免的需要处理一些字符串(文本数据)。如何高效地处理文本数据,将看似杂乱无章的数据整理成可以进行统计分析的规则数据,是『数据玩家』必备的一项重要技能。 在编程语言 阅读全文
posted @ 2017-08-15 20:22 nkwy2012 阅读(657) 评论(0) 推荐(0) 编辑
摘要: R中的grep、grepl、sub、gsub、regexpr、gregexpr等函数都使用正则表达式的规则进行匹配。默认是egrep的规则,也可以选用Perl语言的规则。在这里,我们以R中的sub函数为例(因为该函数可以返回替换字符串后的具体内容)介绍正则表达式的用法。 对该函数的逻辑参数都使用默认 阅读全文
posted @ 2017-08-15 20:18 nkwy2012 阅读(3070) 评论(0) 推荐(0) 编辑