2013年8月15日

mahout的数据文件格式

摘要: 原文地址:https://cwiki.apache.org/confluence/display/MAHOUT/Data+FormatsMahout支持许多格式的文件以便实现各种工作。文件格式可导入的文件格式1. 文本文件 (1)满足以下格式的文本可以转化为流数据文件导入:(行号,行文本)(文件名,文件的全部内容)(行号,行份的用正则表达式模式) (2)可以解析为Lucene索引的文本: 精确的索引设计???(此处不明白为什么会有三个问号,可能有部分文本会失败吧)2. ARFF文件WEKA(来源)项目文本数据格式 可以格式生成流文件的数据3. 邮箱文件 满足以下格式的邮件可以转化为流数据文.. 阅读全文

posted @ 2013-08-15 15:45 AI001 阅读(1138) 评论(0) 推荐(0) 编辑

mahout概述

摘要: 原文地址:https://cwiki.apache.org/confluence/display/MAHOUT/OverviewMahout的目标是建立可扩展的机器学习库。可扩展的的意味着如下: 可扩展到相当大的数据集。核心算法,聚类,分类和批量基于协同过滤并以Apache Hadoop的map / reduce范式实现。但是,使用并不仅限于hadoop,单个的hadoop节点或在非Hadoop集群上都可以运行。核心库的高度优化,以获得较好的性能,即使是非分布式的情况下。 灵活的支持您的业务情况。Mahout是在一个商业友好的Apache软件许可下分发的。 快速扩张的社区。 Mahout的目标 阅读全文

posted @ 2013-08-15 11:31 AI001 阅读(178) 评论(0) 推荐(0) 编辑

基于keepalived的redis系统master双机热备,读数据负载均衡设置方案

摘要: 硬件:机器 ip 作用master 192.168.0.2 redis系统的master主机slave1 192.168.0.3 redis系统的slave机器,和master组成双机热备slave2 192.168.0.4 redis系统的slave机器,和slave1构成读数据的负载均衡系统软件:keepalived,下载地址:www.keepalived.orglvs,下载地址:http://www.linuxvirtualserver.orgredis,下载地址:www.redis.iocentos 6.4版本安装:不采用编译安装的方式,使用yum安装1.安装kernel-devel: 阅读全文

posted @ 2013-08-15 09:56 AI001 阅读(547) 评论(0) 推荐(0) 编辑

导航