摘要:
最近在读Founders at work, Gmail创始人是Google员工几天时间弄出来的;Hotmail的2位创始人,一开始还不敢把自己的idea说出来,怕被别人抄去。蛮多有趣的例子。把Fenng写的文章贴出来分享。以下是转载:Founders at Work为什么有些人创业成功,而更多人失败? 成功的人当初承担过哪些压力,做过那些重要的抉择? 有没有初创公司的创业者们必须要看的一本书?Founders at Work或许能担当此重任。前一段时间在财帮子网站创建人孟岩的推荐后读完了这本书,最近这几天分析Paypal的一些东西,又把电子版翻了出来。重新读了一遍对 Paypal 创始人 Ma 阅读全文
摘要:
Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在 Mahout 的最近版本中还加入了对 Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。具体参见:1) 基于 Apache Mahout 构建社会化推荐引擎2)Apache Mahout 简介3)探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探4) 探索推荐引擎内部的秘密,第 2 部分: 深入推荐引. 阅读全文
摘要:
上回说到了用经纬度范围实现附近地点搜索。 一些小型应用中这样做没问题,但在大型应用中它有个显著的缺点:速度慢。慢的原因有两个, 第一是范围比较的索引利用率并不高,第二是SQL语句极其不稳定(不同的当前位置会产生完全不同的SQL查询),很难缓存。可以考虑使用geohash算法。geohash是一种地址编码,它能把二维的经纬度编码成一维的字符串。比如,北海公园的编码是wx4g0ec1。geohash有以下几个特点:首先,geohash用一个字符串表示经度和纬度两个坐标。某些情况下无法在两列上同时应用索引 (例如MySQL 4之前的版本,Google App Engine的数据层等),利用geoha 阅读全文
摘要:
附近地点搜索,顾名思义,就是搜索用户附近有哪些地点。随着GPS和带有GPS功能的移动设备的普及, 附近地点搜索也变得炙手可热。不过在网上却很少有这方面的讨论。本文的方法并不算最好, 但足以应付一般的应用了。本文中,数据库采用MySQL,语言采用python。理论上别的数据库和语言也没问题, 但我们要在经纬度上设置两个索引,所以如果你的数据库不支持索引,或者不支持在一个查询中使用两个索引, 那就只能想别的办法了。球面最短距离公式球面上任意两点之间的距离计算公式可以参考维基百科上的下述文章,这里就不再赘述了。Great-circle distanceHaversine formula值得一提的是, 阅读全文
摘要:
OpenCV的人脸检测功能在一般场合还是不错的。而ubuntu正好提供了python-opencv这个包,用它可以方便地实现人脸检测的代码。写代码之前应该先安装python-opencv:$ sudo apt-get install python-opencv我测试电脑上提示依赖其他文件,我装了libcurl3,然后重新上面的步骤,就可以了。代码如下:#!/usr/bin/python# -*- coding: UTF-8 -*-# face_detect.py# Face Detection using OpenCV. Based on sample code from:# http://. 阅读全文