摘要: 一、官方案例:定量值地图的创建 数据形式: 过程: 分别双击经纬度(默认的纬度会自动添加到行功能区,经度到列功能区) 将Id放入标记卡详细信息 将Magnitude^10(震级^10)放入大小,(该字段比Magnitude具有更宽的值范围) 将Magnitude放入标记卡颜色 编辑颜色:橙色-蓝色发 阅读全文
posted @ 2020-01-13 22:49 Jude_h 阅读(585) 评论(0) 推荐(0) 编辑
摘要: 1、柱形堆叠图单元格顶部显示总计值(可通过参考线实现) 2、调节图形单元格的宽窄度 (ctrl + 右键/左键) 3、折线图预测区间 趋势区间线 分析中预测并不是针对所有的日期格式均其作用,比如日期格式选择单月格式(“一月”,“二月”..)无法使用预测功能,而格式年月的组合(“2018年1月”,“2 阅读全文
posted @ 2020-01-11 13:58 Jude_h 阅读(1947) 评论(0) 推荐(0) 编辑
摘要: tableau参数可用在计算字段、筛选器和参考线中替换常量值得动态值。 三种方式:1、在计算字段中使用筛选器 案例动态替换计算字段中设定的目标值。 创建参数 以参数值创建计算字段 2、筛选器中使用参数 案列动态选择排名前几的产品类别 (办公用品中排前1-8的子类别) 选出类别中办公用品的类别 创建参 阅读全文
posted @ 2020-01-11 12:45 Jude_h 阅读(2232) 评论(0) 推荐(0) 编辑
摘要: 一、所有问题 Xshell 连接不上 报错类型:Could not connect to '192.168.122.1' (port 22): Connection failed.原因:IP地址未生成解决方法:重新生成ip地址 service network restart,在ifconfig -a 阅读全文
posted @ 2020-01-05 17:00 Jude_h 阅读(815) 评论(0) 推荐(0) 编辑
摘要: 1、数据集,某宝数据。 下载数据后,利用kettle将文本文件导入mysql数据库。数据time从 2014-11-18 00到2014-12-18 23。包含如下字段: item_id(产品ID),behavior_type(包含点击、收藏、加购物车、购买四种行为,分别用数字1、2、3、4表示), 阅读全文
posted @ 2019-11-18 23:37 Jude_h 阅读(945) 评论(0) 推荐(0) 编辑
摘要: 具体过程学习了: 1、连接数据库 2、添加新资源库 3、选择Other Repositories 4、选择Database Repository,第二个需要配置额外参数 5、连接数据库相关设置 6、连接完成后输入账号密码,admin、admin 7、修改密码,探索资源库 8、csv文件上传到数据库 阅读全文
posted @ 2019-11-17 18:40 Jude_h 阅读(3876) 评论(0) 推荐(1) 编辑
摘要: 一、概述 (F检验)显著性检验:检测自变量是否真正影响到因变量的波动。 (t检验)回归系数检验:单个自变量在模型中是否有效。 二、回归模型检验 检验回归模型的好坏常用的是F检验和t检验。F检验验证的是偏回归系数是否不全为0(或全为0),t检验验证的是单个自变量是否对因变量的影响是显著的(或不显著)。 阅读全文
posted @ 2019-11-08 14:33 Jude_h 阅读(20585) 评论(2) 推荐(0) 编辑
摘要: 1、回归(regression)与 分类(Classification)区别,前者处理的是连续型数值变量。后者处理的是类别变量。 2、回归分析:建立方程模拟2个或多个变量之间关联关系。 3、简单线性回归:y=b1*x+b0 1) 参数b1,b0可以由如上公式计算出来,xi,yi为样本中各点。nump 阅读全文
posted @ 2019-11-06 16:38 Jude_h 阅读(1529) 评论(0) 推荐(0) 编辑
摘要: 1、思路 应用Kmeans聚类时,需要首先确定k值,如果k是未知的,需要先确定簇的数量。其方法可以使用拐点法、轮廓系数法(k>=2)、间隔统计量法。若k是已知的,可以直接调用sklearn子模块cluster中Kmeans方法,对数据进行切割。 另外如若数据集不规则,存在量纲上的差异,也需要对其进行 阅读全文
posted @ 2019-10-31 16:53 Jude_h 阅读(2249) 评论(0) 推荐(0) 编辑
摘要: 1、概述 该方法属于无监督学习算法(无y值)。根据已有的数据,利用距离远近的思想将目标数据集聚为指定的k个簇。簇内样本越相似,聚类的效果越好。需要注意的是如若数据存在量纲上的差异,必须先进行标签化处理。或者数据集中含有离散型字符变量,需先设置成哑变量或进行数值化。对于未知簇个数的数据集,需要先确定簇 阅读全文
posted @ 2019-10-30 22:48 Jude_h 阅读(2208) 评论(0) 推荐(0) 编辑