摘要:
用蒙特卡洛方法算pi-基于python和R语言最近follow了MOOC上一门python课,开始学Python。同时,买来了概率论与数理统计,准备自学一下统计。(因为被鄙视过不是统计专业却想搞数据分析)有趣的是书里面有一块讲蒲丰投针计算Pi,这是一种随机模拟法,也就是蒙特卡洛法。蒲丰投针之于我太难... 阅读全文
摘要:
其实这篇博文是一个基于R的爬虫,抓取了1001位知乎姑娘所有答主上传的美照。共800多张图片。😄废话不多说,贴下代码和最后的抓取结果。嗯,😄,我会先贴图再贴代码。这些图片是来源于哪些优秀的知乎问题??(共100个问题)菇凉们的图:(我只抓了100张图,总共有800多张吧)(如有侵犯隐私,请立刻联... 阅读全文
摘要:
如何在linux服务器部署Rstudio server,配置ODBC后通过RODBC包远程访问SQL server背景介绍:之前写过一篇文章,提到近期要部署Rstudio server(搭建数据分析团队的分析环境),花了一个星期,搭好了。还YY过给这个亲生的儿子起个装逼的名字呢,莫扎特,巴赫什么的,... 阅读全文
摘要:
最近的关键字:分类算法,outlier detection,machine learning简介:此文将 k-means,decision tree,random forest,SVM(support vector mechine),人工神经网络(Artificial Neural Network,... 阅读全文
摘要:
一:R本身是单线程的,如何让其多线程跑起来,提高运算速度?用Parallel和foreach包玩转并行计算看完上面这篇文章就会了。说白了,要加载parallel包,再改写一下自己的代码就ok了。#-----用一个实力来演示 R 如何多线程计算func 1) { x %html_ses... 阅读全文
摘要:
龙君蛋君2015年5月24日1.背景介绍最近公司在用R 建模,老板要求用shiny 展示结果,建模的过程中用到诸如kmean聚类,时间序列分析等方法。由于之前看过一篇讨论kmenas聚类针对某一特定数据类型,聚类结果非常不靠谱的文章,于是这个周末突发奇想,用shiny可交互的展示kmeans聚类中的... 阅读全文
摘要:
Cnbolg Crawla). 加载用到的R包##library packages needed in this caselibrary(proto)library(gsubfn)## Warning in doTryCatch(return(expr), name, parentenv, hand... 阅读全文
摘要:
R语言网络爬虫学习 基于rvest包龙君蛋君;2015年3月26日1.背景介绍:前几天看到有人写了一篇用R爬虫的文章,感兴趣,于是自己学习了。好吧,其实我和那篇文章R语言爬虫初尝试-基于RVEST包学习 的主人认识~ 2.知识引用与学习: 1.R语言爬虫初尝试-基于RVEST包学习2.大数据分析之—... 阅读全文
摘要:
1. CSV文件的的读取与写出2. 数据集筛选3. 简单随机抽样 sample函数正文:1. CSV文件的的读取与写出文件读取: df2 newdata newdata manager date country gender age q1 q2 q3 q4 q51 1 2014/10/27 US... 阅读全文