摘要:
假期闲着无聊,做了一下Kaggle练手的项目--预测泰坦尼克号乘客的存活情况。对于一些函数和算法,刚开始也是懵懵懂懂的,但通过自己查资料,还是明白了许多。然后就是自己写的时候还看了下别人的做法,特别是国外的文章,写得很详细,逻辑特别清晰,还把不同算法的结果给你列出来,最后选择了最优算法。好佩服,希望 阅读全文
posted @ 2018-04-07 04:00 风吹白杨的安妮 阅读(12398) 评论(0) 推荐(1) 编辑
摘要:
假期闲着无聊,做了一下Kaggle练手的项目--预测泰坦尼克号乘客的存活情况。对于一些函数和算法,刚开始也是懵懵懂懂的,但通过自己查资料,还是明白了许多。然后就是自己写的时候还看了下别人的做法,特别是国外的文章,写得很详细,逻辑特别清晰,还把不同算法的结果给你列出来,最后选择了最优算法。好佩服,希望 阅读全文
posted @ 2018-04-07 04:00 风吹白杨的安妮 阅读(12398) 评论(0) 推荐(1) 编辑
摘要:
本来今天打算把以前的爬虫记录复制粘贴过来的,后来想想有点没意思,就想再写一次爬虫,顺便加上之前学的可视化数据分析。 有点糊涂,不知道该从哪里说起,也不知道该怎么讲。所以还是按照我自己的爬虫步骤讲吧 这里建议用jupyter notebook编辑,方便数据的展示 总的步骤就是:①导入模块 ②配置绘图风 阅读全文
posted @ 2018-04-03 20:34 风吹白杨的安妮 阅读(9179) 评论(1) 推荐(0) 编辑
摘要:
一、先介绍下什么是RFM模型 客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标: 最近一次消费 (Recency) 消费频率 (Frequency) 消费金额 (Monetary) 该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。 二 阅读全文
posted @ 2018-04-02 21:46 风吹白杨的安妮 阅读(7679) 评论(0) 推荐(0) 编辑
摘要:
把博客文章里的内容都搬到随笔这里来啦~~~~~~~~~~~~~·用R读取各类文件其实很简单,只是有时候要注意一下加载library的顺序,不过没事,一般系统都会提醒你哒! #读取txt文件bank1 <- read.table('user_info.txt',header = F,sep = ',' 阅读全文
posted @ 2018-04-02 19:41 风吹白杨的安妮 阅读(3182) 评论(0) 推荐(0) 编辑
摘要:
这个博客园好奇怪,怎么点开主页先出现的不是博客文章,而是随笔呢? 以前没碰过R,最近开始学习上R语言,一起加油吧^_^ 一、我们先连接上自己的MySQL数据库,代码如下 install.packages('RMySQL')library(RMySQL)con<-dbConnect(MySQL(),h 阅读全文
posted @ 2018-04-02 19:34 风吹白杨的安妮 阅读(1227) 评论(0) 推荐(1) 编辑 |
||