随笔分类 - R Programming
摘要:延续之前的用R语言读琅琊榜小说,继续讲一下利用R语言做一些简单的文本处理、分词的事情。其实就是继续讲一下用R语言读书的事情啦,讲讲怎么用它里面简单的文本处理方法,来优化我们的读书体验,如果读邮件和读代码也算阅读的话。。用的代码超级简单,不涉及其他包
阅读全文
摘要:就是用R语言最基础的东西,加一点点脑洞,来打开琅琊榜小说
阅读全文
摘要:20170209更新: 根据回复提示,rvest包更新,原用函数html作废,需改用read_html 并后续amazon网页改版等 因此此文章代码失效!各位可看评论内容了解详情 等以后有空再重写一遍代码,抱歉。果然代码还是放在github上好啊。。。。 博客总目录:http://www.cnblo
阅读全文
摘要:这两个月没有写什么代码。也没做什么大项目,基本就是对以前写的那个用ggplot2可视化数据的项目做一些增增补补,大部分技术难关都在ggplot2和R语言EXCEL处理这里解决并总结了。然后业余帮人修改一个用RVEST写的亚马逊简陋爬虫,花了两个周末时间。就简单记一下最近弄的这个功能块功能块分区,并自...
阅读全文
摘要:博客内容简介及目录 http://www.cnblogs.com/weibaar/p/6644261.html 本文旨在介绍R语言中ggplot2包的一些精细化操作,主要适用于对R画图有一定了解,需要更精细化作图的人,尤其是那些刚从excel转ggplot2的各位,有比较频繁的作图需求的人。不讨论那
阅读全文
摘要:论R与excel的结合。
分为:
1、 xlsx包安装及注意事项
2、用vba实现xlsx批量转化csv
阅读全文
摘要:在折腾完爬虫还有一些感兴趣的内容后,我最近在看用R语言进行简单机器学习的知识,主要参考了《机器学习-实用案例解析》这本书。这本书是目前市面少有的,纯粹以R语言为基础讲解的机器学习知识,书中涉及11个案例。分12章。作者备注以及代码部分都讲得比较深。不过或许因为出书较早,在数据处理方面,他使用更多的是...
阅读全文
摘要:博客内容简介及目录 http://www.cnblogs.com/weibaar/p/6644261.html Tuesday, March 31, 2015 Tuesday, March 31, 2015 之前用rvest帮人写了一个定期抓取amazon价格库存,并与之前价格比较的小程序,算是近期
阅读全文
摘要:注意:这文章是2月份写的,拉勾网早改版了,代码已经失效了,大家意思意思就好,主要看代码的使用方法吧。。 最近一直在用且有维护的另一个爬虫是KINDLE 特价书爬虫,blog地址见此: http://www.cnblogs.com/weibaar/p/4824578.html 博客内容简介及目录 ht
阅读全文
摘要:博客总目录:http://www.cnblogs.com/weibaar/p/4507801.htmlThursday, January 29, 2015补上第四周笔记,以及本次课程总结。第四周课程主要针对text进行处理。里面包括1.变量名的处理 2.正则表达式 3.日期处理(参见swirl lu...
阅读全文
摘要:Coursera-Getting and Cleaning Data-Week3Wednesday, February 04, 2015好久不写笔记了,年底略忙。。Getting and Cleaning Data第三周其实没什么好说的,一个quiz,一个project,加一个swirl。基本上sw...
阅读全文
摘要:Coursera-Getting and Cleaning Data-Week2Saturday, January 17, 2015课程概述week2主要是介绍从各个来源读取数据。包括MySql,HDF5,webpage,API等,范围还蛮广。因为工作和日常中没有直接到数据库拿数据的权限,所以暂时只...
阅读全文
摘要:博客总目录,记录学习R与数据分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html --Sunday, January 11, 2015课程概述Getting and Cleaning Data是Coursera数据科学专项的第三门课,有中文翻译。但是...
阅读全文
摘要:博客总目录,记录学习R与数据分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html -------经过周末一个半天的努力,终于把这次的Assignment3做出来,然后做完Quiz4,顺利结束R Programming这门课程。对这门课的综合吐槽就是,...
阅读全文
摘要:完成R Programming第三周这周作业有点绕,更多地是通过一个缓存逆矩阵的案例,向我们示范【词法作用域 Lexical Scopping】的功效。但是作业里给出的函数有点绕口,花费了我们蛮多心思。Lexical Scopping:The value of free variables are ...
阅读全文
摘要:博客总目录,记录学习R与数据分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html ---好久没发博客且容我大吼一句终于做完这周R Programming的作业了!之前一直有报coursera的课程,但是总是没有坚持下去,这次收到他们的邮件推广,说da...
阅读全文
摘要:入门书籍:R语言实战进度:1-4章摘要:1)实用的包forecast:用于做时间序列预测的,有auto.arima函数RODBC:可以用来读取excel文件。但据说R对csv格式适应更加良好,相应的导入导出均较为方便(read.table, write等)reshape:目前用到rename函数,可...
阅读全文
摘要:续之前那篇随笔前天写完随笔后,很自豪的拿出来去跟带我入数据挖掘和SAS基础的大牛@八公炫耀,然后收获了一堆时间序列的材料,非常感谢大牛!ARIMA就是看图形,ACF和PACF,原理不需要知道,因为软件已经帮我们解动态方程了总结下来就是1)ARIMA关键是看图形,看ACF和PACF,公式啥的不一定要了...
阅读全文
摘要:博客内容简介及目录 http://www.cnblogs.com/weibaar/p/6644261.html 纪念一下,在心心念念想从会计本科转为数据分析师快两年后,近期终于迈出了使用R的第一步,在参考他人的例子前提下,成功写了几行代码。用成本的角度来说,省去了部门去买昂贵的数据分析软件的金钱和时
阅读全文