上一页 1 2 3 4 5 6 7 8 9 ··· 34 下一页
摘要: r环境概念 环境:用来具体存储对象的地方。 规则1:每一个对象都存储在一个环境当中。 规则2:每一个环境都与一个父环境相连接,构成一个分层的环境系统。 规则3:子环境与父环境的连接是单向的。 parenvs()查看当前R的环境; parenvs(all=TRUE)会返回当前会话包含的环境列表。 as 阅读全文
posted @ 2019-12-16 20:23 foremost 阅读(776) 评论(1) 推荐(0) 编辑
摘要: 一、知识结构 分类问题和逻辑回归? 1)输出数据的类型分类输出的数据类型是离散数据,也就是分类的标签。 回归输出的是连续数据类型。 2)第2个区别是我们想要通过机器学习算法得到什么? 分类算法得到是一个决策面,用于对数据集中的数据进行分类。 回归算法得到是一个最优拟合线,这个线条可以最好的接近数据集 阅读全文
posted @ 2019-12-12 22:07 foremost 阅读(426) 评论(0) 推荐(0) 编辑
摘要: 1.什么是机器学习? 像豆瓣、淘宝、QQ音乐这些推荐系统,背后的秘密武器正是机器学习 机器学习是:用机器学习算法来建立模型,并利用规律和模型对未知数据进行预测。 监督学习 supervised learning; 非监督学习 unsupervised learning; 半监督学习 semi-sup 阅读全文
posted @ 2019-12-12 10:53 foremost 阅读(6166) 评论(0) 推荐(0) 编辑
摘要: 安装xlsx包 #装之前先装jdk,配置环境变量 install.packages("xlsx") 代表安装成功 必须先加载包然后再使用包library() $提取符号 当一个函数里需要返回多个值(比如有变量,有向量,有矩阵)时,我们要用list,而不是return,这时如果想提取某个变量的结果,就 阅读全文
posted @ 2019-12-10 20:30 foremost 阅读(910) 评论(0) 推荐(0) 编辑
摘要: 1、R语言介绍 R和RStudio 是与计算机进行对话的两个工具 RStudio 是话筒 R是沟通所用的语言 R的由来:基于S语言,由新西兰奥克兰大学的Robert Gentleman和Ross Ihaka开发,因两位开发者名字首字母都是R,所以该语言命名为R。 怎样理解R 一种计算机语言 一种用于 阅读全文
posted @ 2019-12-06 23:12 foremost 阅读(1696) 评论(0) 推荐(0) 编辑
摘要: 一、数据分析的步骤 二、提出问题 (1) 分析数据分析师主要的技能排名? (2) 分析数据分析师薪资和岗位地点、学历、工作年限的关系? (3) 数据分析师的学历需求? (4) 不同城市数据分析师的需求?(地图展示) 三、获取数据源 选择前程无忧官网 关键词:数据分析师 范围:全国 总记152页信息, 阅读全文
posted @ 2019-11-28 21:38 foremost 阅读(2290) 评论(1) 推荐(0) 编辑
摘要: 一、matplotlib介绍 python优秀的数据可视化第三方库 matplotlib库的效果 官网:https://matplotlib.org/ 当我们想画一个图但不知道怎么画出来的时候,就可以去这个网站上去找了,网站上罗列出来了各式各样的绘图形式 配置参数: axex: 设置坐标轴边界和表面 阅读全文
posted @ 2019-11-25 19:18 foremost 阅读(779) 评论(0) 推荐(0) 编辑
摘要: import pandas as pd import numpy as np Step 1.加载数据集 # header=0以第一行作为列名 tip = pd.read_csv("lianx.csv",sep=',',header=0) tip.head() Step 2.删除第 1,4,7,9,1 阅读全文
posted @ 2019-11-24 21:06 foremost 阅读(456) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘的十大算法 基本概念 1、数据预处理:处理成 用户ID,R ,F,M四个字段 2、调用KMeans算法 进行聚类 ,设定为8类 3、对数据进行拟合,训练模型 ,每个ID对应一个类别(0-7) 4、如何将分类好的数字标签,和RFM 模型中的客户类别匹配起来? 查看每个类别的中心点,用其构造Da 阅读全文
posted @ 2019-11-24 19:33 foremost 阅读(2579) 评论(1) 推荐(0) 编辑
摘要: 一、数据分析的步骤 二、提出问题 分析药店商品销售情况 1)月均消费次数 2)月均消费金额 3)客单价 4)消费趋势 5)热销商品、滞销商品 三、理解数据 销售数据源为excel文件 字段的含义: 共有6579条销售数据 共有7个字段分别为:购买时间、社保卡号、商品编码、商品名称、销售数量、应收金额 阅读全文
posted @ 2019-11-23 21:28 foremost 阅读(1277) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 34 下一页