小团队撬动大数据——当当推荐团队的机器学习实践
摘要:
当当个性化推荐开发经理张相於深度分享当当推荐团队的机器学习实践经验,侧重介绍一个小团队在构建系统时的一些实践,一些坑,以及如何从坑里爬出来。当当构建机器学习系统过程中踩过的坑主要包括:只见模型,不见系统;不重视可视化分析工具;过于依赖算法;关键流程和数据没有掌握在自己团队;团队不够“全栈”;巨型系统。工具方面,当当在探索阶段选择的是R和Python,大数据阶段则主要依靠Hadoop和Spark,目前集群是几百台的规模。在“全流程构建”的不断迭代中,当当还总结提取出的一套特征工程相关的工具——dmilch 阅读全文
posted @ 2015-10-19 14:00 xueyoo 阅读(262) 评论(0) 推荐(0) 编辑