摘要: http://zhidao.baidu.com/link?url=tAgvz92-che9GSuqncTTh4MVicXzzEB7O2Xwce9DibqUXqBzYdFocGWlgBvU6J-Vi8s3zKt5sarfGzviAAj0rKhttp://bbs.csdn.net/topics/70247106 阅读全文
posted @ 2013-12-23 11:55 _Eric.Liu 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 动机先前写了一篇文章《SIFT算法研究》讲了讲SIFT特征具体是如何检测和描述的,其中也提到了SIFT常见的一个用途就是物体识别,物体识别的过程如下图所示:如上图(a),我们先对待识别的物体的图像进行SIFT特征点的检测和特征点的描述,然后得到了SIFT特征点集合。接下来生成物体目标描述要做的就是对特征点集合进行数据组织,形成一种特殊的表示,其作用是为了加速特征点匹配的过程。所谓的特征点匹配本质上是一个通过距离函数(例如欧式距离)在高维矢量之间进行相似性检索的问题,简单来讲就是范围查询或者K近邻查询的问题。范围查询就是给定查询点和查询距离阈值,从数据集中找出所有与查询点距离小于查询距离阈值的数 阅读全文
posted @ 2013-11-01 21:18 _Eric.Liu 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 浙大CS今年毕业的平均在15万左右,而且每年涨7万!比MIT计算机博士2万刀(13万)的奖学金多多了!1,美国博士=基本失业,或是远远低于自己期望的工作!2,美国硕士:UIUC、伯克利、密歇根之类的大学,按国内的竞争力绝对赶不上大陆top10的硕士!3,英联邦硕士:按国内的竞争力绝对赶不上大陆top100的硕士幻想出国读书赚钱的,请打消这个念头,在上海北京找个好大学好专业,出来找工作绝对比留学好!幻想出国读书学术的,请打消这个念头,你在美国就是导师的民工,今后能进学术界的几率很低!更别提:神马XX State University,这类大学还真不如读个国内的研究生!而且现在工作后出国的机会非常 阅读全文
posted @ 2013-11-01 11:16 _Eric.Liu 阅读(1982) 评论(0) 推荐(0) 编辑
摘要: Kafka是一个高吞吐量分布式消息系统。linkedin开源的kafka。 Kafka就跟这个名字一样,设计非常独特。首先,kafka的开发者们认为不需要在内存里缓存什么数据,操作系统的文件缓存已经足够完善和强大,只要你不搞随机写,顺序读写的性能是非常高效的。kafka的数据只会顺序append,数据的删除策略是累积到一定程度或者超过一定时间再删除。Kafka另一个独特的地方是将消费者信息保存在客户端而不是MQ服务器,这样服务器就不用记录消息的投递过程,每个客户端都自己知道自己下一次应该从什么地方什么位置读取消息,消息的投递过程也是采用客户端主动pull的模型,这样大大减轻了服务器的负担。Ka 阅读全文
posted @ 2013-10-31 18:44 _Eric.Liu 阅读(363) 评论(0) 推荐(0) 编辑
摘要: http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=MachineLearning 阅读全文
posted @ 2013-10-30 18:02 _Eric.Liu 阅读(267) 评论(0) 推荐(0) 编辑
摘要: http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=DeepLearning 阅读全文
posted @ 2013-10-30 17:57 _Eric.Liu 阅读(500) 评论(0) 推荐(0) 编辑
摘要: 统计一天微博内“taobao.com”出现次数,每小时记录一次:for i in {00..23}; do hive -e "select count(*) from mds_anti_sass_log where source=3 and type=1 and args['content'] like '%taobao.com%' and dt=20131028 and hour=$i;" >> log.txt; done统计某一小时微博内“taobao.com”出现次数:hive -e "select args[&# 阅读全文
posted @ 2013-10-30 15:47 _Eric.Liu 阅读(844) 评论(0) 推荐(0) 编辑