2011年9月5日

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用22

摘要: 成功的捷径文本的术语向量生成,术语向量距离计算,术语向量的相似度计算......,吴言这些天一直忙于这些功能的实现,终于吴言可以根据产品的描述信息计算出产品的相似度,也可以根据用户的描述信息、博客、评论计算用户的相似度,以这些为基础,吴言就可以做产品推荐了,例如用户在浏览某个产品时,就可以在页面下方列出“喜欢这个商品的用户还喜欢......”,或者当一个用户登录后,可以给他列出“您可能感兴趣的用户......”,其实这些网站上看似很平常的功能,后面其实隐藏着很多高深的算法。吴言从自己不熟悉的寻找投资的领域又一次回到了自己的程序开发领域,虽然这些概念对他来讲很新,也有些复杂,但是还是感觉得心应手 阅读全文

posted @ 2011-09-05 12:03 最老程序员闫涛 阅读(3372) 评论(22) 推荐(13) 编辑

2011年9月2日

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用21

摘要: 主动出击因为现在系统已经上线,并且无论在搜索引擎排名还是Alexa排名上都有所进展,吴言准备再次启动寻找投资的道路。但是怎样才能找到VC,吴言仍然毫无头绪,没办法只好还从Google搜索开始。通过搜索创业、天使投资、VC这些关键词,搜出的结果五花八门,很难从中发现有价值的信息。忽然有一个新闻稿映入了吴言的眼帘:“从农民的儿子到青年企业家---记中石化燃油集供公司CEO陈永强”。这么巧,名字和小A的... 阅读全文

posted @ 2011-09-02 12:03 最老程序员闫涛 阅读(3463) 评论(25) 推荐(16) 编辑

2011年9月1日

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用20

摘要: 员工离职之痛吴言今年是订的初四的回程火车票,因此初四早晨就得动身,走到十几里外的汽车站做车。从初三下午开始,父母就在给吴言收拾行李,虽然吴言一再说路上带着不方便,但是父母还是顽固地给他收拾了整整一袋子东西,吴言每次回京,拎着父母都舍不得吃的东西,都深深地体会到了亲情的沉重。这次春劫,吴言觉得将春节叫春劫更合适,吴言一共花了一万多,先是给了父母五千块钱明年春耕时的钱,然后是到姑姑、姨家拜年,给外甥、... 阅读全文

posted @ 2011-09-01 12:22 最老程序员闫涛 阅读(4141) 评论(33) 推荐(20) 编辑

2011年8月31日

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用19

摘要: 春节虽然离春节还有一个半月,但是过年的气氛已经开始变得越来越浓了,人们已经开始谈论着买回家的火车票,行程安排等等信息,周围都迷漫着越来越浓的年的味道。每年到这个时候,吴言都会感到未名烦燥。又一年过去,又是一事无成,今年尤其如此,连往年还算说得过去的工作都没有了,而且自己的终身大事也依然没有着落,想起要回家,面对亲戚朋友或关心或非议的目光,吴言从心里感到一丝丝的恐惧,而且这种恐惧随着年龄的增长越来越强烈,今年更是如此,感觉就像是一个令人恐惧的幽灵在身边徘徊,挥之不去。吴言深深地出了一口气,将纷乱的思绪收回来,把精力重新集中到工作上。咦?这是怎么回事,吴言在试用关于产品博客打分功能时,明明给产品博 阅读全文

posted @ 2011-08-31 12:01 最老程序员闫涛 阅读(3442) 评论(30) 推荐(12) 编辑

2011年8月30日

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用18

摘要: 英语复习课终于完成了商品相似度计算程序,吴言伸了个懒腰,走到窗前准备放松一下。吴言站在窗前向窗外望着,今天天阴得特别沉,才三点多钟,屋里就必须要开灯了。空气中迷漫着浓浓的水汽,仿佛可以拧出水来似的,应该是快要下雪了。转眼已经进入十二月份了,离自己离职创业已经有将近四个月的时间了,自己的项目到现在前景还不算明朗,一想到这些吴言的心里就不免有些着急。吴言正在沉思着,忽然手机响了起来。吴言赶紧跑过去拿起手机,一看是一个186开头的陌生号码,会是谁呢?不会是打错了吧?但是对方顽固的坚持着。吴言不情愿地接通了电话,充满戒心的问道:“喂?找哪位?”“嘿,吴言吗?我是梁秀娟!最近好吗?”对方答着。“原来是小 阅读全文

posted @ 2011-08-30 12:04 最老程序员闫涛 阅读(3373) 评论(27) 推荐(10) 编辑

2011年8月29日

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用17

摘要: 专注还是活着转眼一个月过去,吴言的项目在缓慢但是坚定的进步着,再有两三个月,这个产品应该就可以上线了,这使吴言很欣慰。但是这个介于alpha版和Beta版之间的版本上线之后,下一步再要做什么吴言目前还没有很好的打算。这天吴言正在做着程序,忽然接到了同学钟永发的电话,吴言与钟永发大毕业后的联系并不多,只知道他去了江西的一家科研院所,是做导弹的,前几年因为台湾问题,忙得总是加班,不过每年都能分个二三十万,后来在当地找了一个特别漂亮的媳妇,日子过得挺滋润。他打电话来干什么呢?吴言充满疑惑地接起了电话:“喂?永发呀!最近怎么样?”“还行吧!听小A说你开始创业了,打电话过来问问。就是,像你们这些牛人,早 阅读全文

posted @ 2011-08-29 12:50 最老程序员闫涛 阅读(2900) 评论(12) 推荐(6) 编辑

2011年8月26日

全文检索、数据挖掘、推荐引擎系列5---文章术语向量表示法

摘要: 无论是要进行全文检索,还是对文章进行自动聚类分析,都需要将文章表示为术语向量(Term Vector),在Lucene内部就是通过术语向量来对文章进行索引和搜索的,但是Lucene没有向外提供合适的术语向量计算接口,所以对术语向量计算还必须我们自己来做。术语向量解述众所周知,一篇文章由一个个的单词组成,我们在进行文本处理时,首先进行中文分词,包括去除“的、地、得”等常用停止词,对关键词加上同义词,如缩写和全称,如果是英文可能还需要变为小写,去除复数和过去分词等,可能还需要提取词根,总之经过上述步聚的预处理,文章将变成由一系列单词组成的字符串数组。对一系统中的每一篇文章,我们首先计算每个单词的出 阅读全文

posted @ 2011-08-26 17:17 最老程序员闫涛 阅读(1748) 评论(3) 推荐(4) 编辑

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用16

摘要: 工作中的细节吴言的新公司好像一切都进展得很顺利,经过一周左右的磨合时间,大家彼此都变得熟悉起来,每个人也基本进入了工作状态。吴言对此非常满意,第一次转型做管理的自己,在最关键的第一周并没有出现大的失误,这个小团队已经开始工作了。但是吴言还是注意到了一些问题,虽然这些问题很小,但是吴言觉得还是需要做些处理才行。吴言首先发现,李卫东的优点是做工作非常认真,他做出的功能模块,自己在测试时从来没出现过问题,有时即使故意输入些非法数据,程序也可以非常好的处理这些异常情况。对于这点吴言相当满意,觉得李卫东将来一定可以成为一个非常优秀的人才。但是李卫东也有一个缺点,就是基础知识不扎实,一遇到问题就会束手无策 阅读全文

posted @ 2011-08-26 12:20 最老程序员闫涛 阅读(3383) 评论(26) 推荐(12) 编辑

2011年8月25日

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用15

摘要: 第一次公司全会今天是吴言约定的三个新员工报到的第一天,吴言提前就把办公室的卫生又好好搞了一遍,同时为他们分配好了座位,赵文涛和李卫东同是做开发的,坐在主卧靠窗的两个座位,曾玉洁将会做产品录入以及部分软件质量保证的工作,坐在客厅里,自己也先不坐在自己的办公室,而是坐在客厅里,这样沟通更方便。安排好所有的事情之后,吴言就开始静静地等着他们的到来。吴言好奇地想第一个到来的会是谁呢?咚咚咚,一阵敲门声,吴... 阅读全文

posted @ 2011-08-25 11:58 最老程序员闫涛 阅读(3457) 评论(26) 推荐(13) 编辑

2011年8月24日

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用14

摘要: 第一批员工吴言把自己租的房子换成了一个临街的两室两厅的单元房,里边只有简单的装修,并且没有家居和家电,虽然每月3500的租金有些贵,但是却可以同时解决吴言住宿和办公问题,吴言还是觉得挺值的。吴言首先买了个简易的地毯,铺在了原本是地砖的地上,因为这样可以防止电脑椅来回移动时产生的噪音影响邻居。然后吴言在比较大的客厅和主卧室里各摆上了四个电脑桌,这样可以方便大家的交流,同时也保证了大家都有相对隐密的个人空间,吴言觉得自己原来公司的开放式办公环境,一点私密空间都没有,感觉很不人性化,当这次自己可以做主时,在成本允许的情况下,他想尽量做到人性化。将电源线和网线都从地毯下穿过,并给每个桌子上配置了电脑, 阅读全文

posted @ 2011-08-24 12:00 最老程序员闫涛 阅读(3269) 评论(22) 推荐(9) 编辑

导航