Jude_h - 博客园

2020年1月13日

摘要：一、官方案例：定量值地图的创建数据形式：过程：分别双击经纬度（默认的纬度会自动添加到行功能区，经度到列功能区）将Id放入标记卡详细信息将Magnitude^10（震级^10）放入大小，(该字段比Magnitude具有更宽的值范围) 将Magnitude放入标记卡颜色编辑颜色：橙色-蓝色发阅读全文

posted @ 2020-01-13 22:49 Jude_h 阅读(599) 评论(0) 推荐(0) 编辑

2020年1月11日

tableau中图形分析相关设置

摘要： 1、柱形堆叠图单元格顶部显示总计值（可通过参考线实现） 2、调节图形单元格的宽窄度（ctrl + 右键/左键） 3、折线图预测区间趋势区间线分析中预测并不是针对所有的日期格式均其作用，比如日期格式选择单月格式（“一月”，“二月”..）无法使用预测功能，而格式年月的组合（“2018年1月”，“2 阅读全文

posted @ 2020-01-11 13:58 Jude_h 阅读(1989) 评论(0) 推荐(0) 编辑

tableau-参数

摘要： tableau参数可用在计算字段、筛选器和参考线中替换常量值得动态值。三种方式：1、在计算字段中使用筛选器案例动态替换计算字段中设定的目标值。创建参数以参数值创建计算字段 2、筛选器中使用参数案列动态选择排名前几的产品类别（办公用品中排前1-8的子类别）选出类别中办公用品的类别创建参阅读全文

posted @ 2020-01-11 12:45 Jude_h 阅读(2319) 评论(0) 推荐(0) 编辑

2020年1月5日

mongodb安装到配置问题

摘要：一、所有问题 Xshell 连接不上报错类型：Could not connect to '192.168.122.1' (port 22): Connection failed.原因：IP地址未生成解决方法：重新生成ip地址 service network restart，在ifconfig -a 阅读全文

posted @ 2020-01-05 17:00 Jude_h 阅读(831) 评论(0) 推荐(0) 编辑

2019年11月18日

用户行为分析

摘要： 1、数据集，某宝数据。下载数据后，利用kettle将文本文件导入mysql数据库。数据time从 2014-11-18 00到2014-12-18 23。包含如下字段： item_id（产品ID），behavior_type（包含点击、收藏、加购物车、购买四种行为，分别用数字1、2、3、4表示），阅读全文

posted @ 2019-11-18 23:37 Jude_h 阅读(995) 评论(0) 推荐(0) 编辑

2019年11月17日

kettle将csv文件导入数据库

摘要：具体过程学习了： 1、连接数据库 2、添加新资源库 3、选择Other Repositories 4、选择Database Repository，第二个需要配置额外参数 5、连接数据库相关设置 6、连接完成后输入账号密码，admin、admin 7、修改密码，探索资源库 8、csv文件上传到数据库阅读全文

posted @ 2019-11-17 18:40 Jude_h 阅读(4078) 评论(0) 推荐(1) 编辑

2019年11月8日

多元线性回归模型检验和预测

摘要：一、概述（F检验）显著性检验：检测自变量是否真正影响到因变量的波动。（t检验）回归系数检验：单个自变量在模型中是否有效。二、回归模型检验检验回归模型的好坏常用的是F检验和t检验。F检验验证的是偏回归系数是否不全为0（或全为0），t检验验证的是单个自变量是否对因变量的影响是显著的（或不显著）。阅读全文

posted @ 2019-11-08 14:33 Jude_h 阅读(21532) 评论(2) 推荐(0) 编辑

2019年11月6日

线性回归模型

摘要： 1、回归（regression）与分类（Classification）区别，前者处理的是连续型数值变量。后者处理的是类别变量。 2、回归分析：建立方程模拟2个或多个变量之间关联关系。 3、简单线性回归：y=b1*x+b0 1) 参数b1,b0可以由如上公式计算出来，xi,yi为样本中各点。nump 阅读全文

posted @ 2019-11-06 16:38 Jude_h 阅读(1619) 评论(0) 推荐(0) 编辑

2019年10月31日

Kmeans应用

摘要： 1、思路应用Kmeans聚类时，需要首先确定k值，如果k是未知的，需要先确定簇的数量。其方法可以使用拐点法、轮廓系数法（k>=2）、间隔统计量法。若k是已知的，可以直接调用sklearn子模块cluster中Kmeans方法，对数据进行切割。另外如若数据集不规则，存在量纲上的差异，也需要对其进行阅读全文

posted @ 2019-10-31 16:53 Jude_h 阅读(2290) 评论(0) 推荐(0) 编辑

2019年10月30日

Kmeans算法

摘要： 1、概述该方法属于无监督学习算法（无y值）。根据已有的数据，利用距离远近的思想将目标数据集聚为指定的k个簇。簇内样本越相似，聚类的效果越好。需要注意的是如若数据存在量纲上的差异，必须先进行标签化处理。或者数据集中含有离散型字符变量，需先设置成哑变量或进行数值化。对于未知簇个数的数据集，需要先确定簇阅读全文

posted @ 2019-10-30 22:48 Jude_h 阅读(2328) 评论(0) 推荐(0) 编辑

公告