摘要: 用蒙特卡洛方法算pi-基于python和R语言最近follow了MOOC上一门python课,开始学Python。同时,买来了概率论与数理统计,准备自学一下统计。(因为被鄙视过不是统计专业却想搞数据分析)有趣的是书里面有一块讲蒲丰投针计算Pi,这是一种随机模拟法,也就是蒙特卡洛法。蒲丰投针之于我太难... 阅读全文
posted @ 2015-10-22 22:51 龙君蛋君 阅读(7841) 评论(0) 推荐(0) 编辑
摘要: 其实这篇博文是一个基于R的爬虫,抓取了1001位知乎姑娘所有答主上传的美照。共800多张图片。😄废话不多说,贴下代码和最后的抓取结果。嗯,😄,我会先贴图再贴代码。这些图片是来源于哪些优秀的知乎问题??(共100个问题)菇凉们的图:(我只抓了100张图,总共有800多张吧)(如有侵犯隐私,请立刻联... 阅读全文
posted @ 2015-10-04 15:59 龙君蛋君 阅读(3639) 评论(5) 推荐(3) 编辑
摘要: 如何在linux服务器部署Rstudio server,配置ODBC后通过RODBC包远程访问SQL server背景介绍:之前写过一篇文章,提到近期要部署Rstudio server(搭建数据分析团队的分析环境),花了一个星期,搭好了。还YY过给这个亲生的儿子起个装逼的名字呢,莫扎特,巴赫什么的,... 阅读全文
posted @ 2015-09-28 10:23 龙君蛋君 阅读(4012) 评论(0) 推荐(1) 编辑
摘要: 最近的关键字:分类算法,outlier detection,machine learning简介:此文将 k-means,decision tree,random forest,SVM(support vector mechine),人工神经网络(Artificial Neural Network,... 阅读全文
posted @ 2015-08-16 22:33 龙君蛋君 阅读(2066) 评论(0) 推荐(1) 编辑
摘要: 一:R本身是单线程的,如何让其多线程跑起来,提高运算速度?用Parallel和foreach包玩转并行计算看完上面这篇文章就会了。说白了,要加载parallel包,再改写一下自己的代码就ok了。#-----用一个实力来演示 R 如何多线程计算func 1) { x %html_ses... 阅读全文
posted @ 2015-07-19 15:38 龙君蛋君 阅读(13893) 评论(0) 推荐(1) 编辑
摘要: 龙君蛋君2015年5月24日1.背景介绍最近公司在用R 建模,老板要求用shiny 展示结果,建模的过程中用到诸如kmean聚类,时间序列分析等方法。由于之前看过一篇讨论kmenas聚类针对某一特定数据类型,聚类结果非常不靠谱的文章,于是这个周末突发奇想,用shiny可交互的展示kmeans聚类中的... 阅读全文
posted @ 2015-05-24 12:08 龙君蛋君 阅读(2583) 评论(5) 推荐(0) 编辑
摘要: Cnbolg Crawla). 加载用到的R包##library packages needed in this caselibrary(proto)library(gsubfn)## Warning in doTryCatch(return(expr), name, parentenv, hand... 阅读全文
posted @ 2015-04-10 21:04 龙君蛋君 阅读(5195) 评论(8) 推荐(0) 编辑
摘要: R语言网络爬虫学习 基于rvest包龙君蛋君;2015年3月26日1.背景介绍:前几天看到有人写了一篇用R爬虫的文章,感兴趣,于是自己学习了。好吧,其实我和那篇文章R语言爬虫初尝试-基于RVEST包学习 的主人认识~ 2.知识引用与学习: 1.R语言爬虫初尝试-基于RVEST包学习2.大数据分析之—... 阅读全文
posted @ 2015-03-26 22:45 龙君蛋君 阅读(9534) 评论(14) 推荐(2) 编辑
摘要: 1. CSV文件的的读取与写出2. 数据集筛选3. 简单随机抽样 sample函数正文:1. CSV文件的的读取与写出文件读取: df2 newdata newdata manager date country gender age q1 q2 q3 q4 q51 1 2014/10/27 US... 阅读全文
posted @ 2014-11-13 22:10 龙君蛋君 阅读(1081) 评论(0) 推荐(0) 编辑