摘要: “点对点”之间的误差 Residural: SSE : MSE : RMSE : SAE : MAE : MAPE : (是一个相对值) Residural: SSE : MSE : RMSE : SAE : MAE : MAPE : (是一个相对值) "点对全"之间的误差 SSR : SST : 阅读全文
posted @ 2017-12-24 10:18 Iris ^ 阅读(559) 评论(0) 推荐(0) 编辑
摘要: 1、geohash及其性质 一种空间索引技术。 (1)将二维的经纬度位置数据转换为一维的字符串(基本上hash族的算法都是这样); 其优点在于hash编码后的字符串,可以方便查找和索引,从而减少相似计算的计算量(不需要再去两两计算距离,而是缩小了比较的范围,减少了计算量、提高了效率); (2)字符串 阅读全文
posted @ 2017-12-14 09:41 Iris ^ 阅读(1621) 评论(0) 推荐(0) 编辑
摘要: 1、点序列 模式发生时间的一个有序序列,se=<t1,t2,t3,t4,t5> 2、周期点序列 <0,5,10,15,20,27,30,35,40>是一个周期为5、时间容忍度为2的周期点序列。 3、部分周期模式 <0,5,10,15,27,30,35,40>可以分为<0,5,10,15>、<15,2 阅读全文
posted @ 2017-11-05 10:08 Iris ^ 阅读(2805) 评论(0) 推荐(0) 编辑
摘要: Kafka是一个分布式的发布/订阅消息系统。 1、producer和consumer是kafka的概念,发送消息到“topic”的就是“producer”;订阅“topic”和处理“feeds of message” 的就叫“consumer”; 2、broker是kafka集群上的服务器,每一个k 阅读全文
posted @ 2017-01-18 22:38 Iris ^ 阅读(322) 评论(0) 推荐(0) 编辑
摘要: 1、安装相应的软件 (1)安装jdk 下载地址:http://www.Oracle.com/technetwork/java/javase/downloads/index.html (2)安装scala 下地地址: http://www.scala-lang.org/ (3)安装spark 下载地址 阅读全文
posted @ 2016-03-04 11:33 Iris ^ 阅读(2066) 评论(0) 推荐(0) 编辑
摘要: 1、从官网http://www.scala-lang.org/download/下载scala二进制通用版本以后,在终端命令行添加下载解压包的bin目录到环境变量:export PATH=/Users/iris/Downloads/scala-2.11.7/bin:$PATH2、输入scala即可进... 阅读全文
posted @ 2016-01-05 11:29 Iris ^ 阅读(2639) 评论(0) 推荐(0) 编辑
摘要: 一、下载安装包:http://mahout.apache.org/general/downloads.html二、解压:将下载的安装包解压到需要的目录下三、配置环境变量:export MAHOUT_HOME=/Users/iris/Downloads/apache-mahout-distributi... 阅读全文
posted @ 2015-10-16 15:32 Iris ^ 阅读(2048) 评论(0) 推荐(0) 编辑
摘要: 最近在学习mahout,这些安装相关软件的步骤先记下来,避免以后忘记。1、首先在mac上查看本机的java版本,如果没有需要自己去安装: 我的电脑上安装的java是1.7.0_792、在http://maven.apache.org/download.cgi上下载相应版本的maven,我当时下载的是... 阅读全文
posted @ 2015-10-15 17:31 Iris ^ 阅读(1351) 评论(0) 推荐(0) 编辑
摘要: Elastic search在数据分析的应用中相当于一个数据库的搜索引擎。跟MySQL类似,它有自己的查询语言,只不过不是关系型数据库,属于NoSQL。可以根据索引从分布式服务器文件系统中快速存取数据。mysql的数据库和表存放在某台服务器上,使用的时候连接到服务器对数据库进行操作,数据使用unic... 阅读全文
posted @ 2015-09-30 18:40 Iris ^ 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 使用python的机器学习包sklearn的时候,如果训练集是固定的,我们往往想要将一次训练的模型结果保存起来,以便下一次使用,这样能够避免每次运行时都要重新训练模型时的麻烦。 在python里面,有一个joblib可以实现将模型保存,并将保存后的模型取出用于不同的测试集: 1 from sk... 阅读全文
posted @ 2015-08-26 20:48 Iris ^ 阅读(20906) 评论(0) 推荐(1) 编辑