摘要: 一、环境准备首先肯定是配置开发环境,这里暂时不作详细描述。需要的环境有jdk1.7,MyEclipse,SVN,ant,以及MyEclipse下的三个插件subclipse 、IvyDe和m2e,下载地址http://subclipse.tigris.org/update_1.8.x和http://... 阅读全文
posted @ 2014-08-08 10:07 Wilco 阅读(1215) 评论(0) 推荐(1) 编辑
  2014年11月26日
摘要: 1、nutch2.3-snapshot中batchid为null引发的.NullPointerException异常:Exception in thread "main" java.lang.NullPointerExceptionat org.apache.nutch.parse.ParserJo... 阅读全文
posted @ 2014-11-26 10:31 Wilco 阅读(188) 评论(0) 推荐(0) 编辑
  2014年11月20日
摘要: From:http://www.thebigdata.cn/JieJueFangAn/11932p2.htmlOnline-to-Offline( 简称 O2O)电子商务模式,是一个连接线上用户和线下商家的多边平台商业模式。 O2O 商业模式将实体经济与线上资源融合在一起,使网络成为实体经济延伸到虚... 阅读全文
posted @ 2014-11-20 21:21 Wilco 阅读(1561) 评论(0) 推荐(0) 编辑
摘要: Google近年来发布的有关文本挖掘、自然语言处理的数据集。http://t.cn/z8sMlZv关键词抽取的demohttp://115.28.183.178/#/cloud问: 做基于话题的社交网络中的溯源,寻找源头用户, 求文章? 答: 找到5篇论文http://t.cn/RhW6Suk特别推... 阅读全文
posted @ 2014-11-20 21:20 Wilco 阅读(146) 评论(0) 推荐(0) 编辑
摘要: From:http://www.cnblogs.com/tornadomeet/p/3395593.html 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话... 阅读全文
posted @ 2014-11-20 20:12 Wilco 阅读(142) 评论(0) 推荐(0) 编辑
摘要: From:http://blog.jobbole.com/53546/很多人觉得机器学习高不可攀,认为这是一门只有少数专业学者才了解的神秘技术。毕竟,你是在让运行在二进制世界里的机器得出它自己对现实世界的认识。你正在教它们如何思考。然而,本文几乎不是你所认为的晦涩难懂、复杂而充满数学公式的文章。正如... 阅读全文
posted @ 2014-11-20 20:08 Wilco 阅读(147) 评论(0) 推荐(0) 编辑
摘要: From:http://blog.jobbole.com/58937/事实上有许多的途径可以了解机器学习,也有许多的资源例如书籍、公开课等可为所用,一些相关的比赛和工具也是你了解这个领域的好帮手。本文我将围绕这个话题,给出一些总结性的认识,并为你由程序员到机器学习高手的蜕变旅程中提供一些学习指引。机... 阅读全文
posted @ 2014-11-20 20:04 Wilco 阅读(492) 评论(0) 推荐(0) 编辑
摘要: From:http://blog.jobbole.com/60809/在理解了我们需要解决的机器学习问题之后,我们可以思考一下我们需要收集什么数据以及我们可以用什么算法。本文我们会过一遍最流行的机器学习算法,大致了解哪些方法可用,很有帮助。机器学习领域有很多算法,然后每种算法又有很多延伸,所以对于一... 阅读全文
posted @ 2014-11-20 20:01 Wilco 阅读(165) 评论(0) 推荐(0) 编辑
摘要: From:http://machinelearningmastery.com/practical-machine-learning-problems/Practical Machine Learning ProblemsWhat is Machine Learning? We can readaut... 阅读全文
posted @ 2014-11-20 19:41 Wilco 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.ctocio.com/hotnews/15919.html机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一... 阅读全文
posted @ 2014-11-20 19:35 Wilco 阅读(368) 评论(0) 推荐(0) 编辑
摘要: 转自:http://blog.csdn.net/lantian0802/article/details/383334791.基础概念:(1) 10折交叉验证:英文名是10-fold cross-validation,用来测试算法的准确性。是常用的测试方法。将数据集分成10份。轮流将其中的9份作为训练... 阅读全文
posted @ 2014-11-20 19:32 Wilco 阅读(236) 评论(0) 推荐(0) 编辑