摘要:
心血来潮,同时想用C++连连手。面对如火如荼的MP,一阵念头闪过,如果把一些ML领域的玩意整合到MP里面是不是很有意思确实很有意思,可惜mahout来高深,我也看不懂。干脆自动动手丰衣足食,加上自己对JAVA一窍不通,于是写了streming C++版的ID3,数据源是来大神orisun的原始数据。整个过程都是下班后一边带孩子一边撰写,总共历时2周多,写了两个版本:1,shell+streming(屌丝版,MP运行速度在3分钟,单机OS运行速度541毫秒)2,streaming一次成型(高富帅版,MP运行速度23秒,单机OS运行速度42毫秒)先贴一些ID3的数据流向,ID3 先算每种因素的出现 阅读全文