05 2008 档案

摘要:利用excel做线性增长预测 昨天看了个帖子http://www.cnblogs.com/shenyisyn/archive/2008/05/20/1203061.html,自己写程序实现线性预测,其实excel也有这功能。假如我们知道了1季度的每天的销售额,我们要推算出后半年的销售额,以便制定原材料采购计划。当然销售量受很多因素影响,季节,营销,地区等,我们先不考虑这些情况,单纯利用线性公式来做预测,如果要把多种属性进行考虑和建模的话,得用sqlserver的BI功能了。 阅读全文
posted @ 2008-05-23 12:42 蛙蛙王子 阅读(3655) 评论(14) 推荐(0) 编辑
摘要:困了,不多说了,就是教你怎样把邮件建立索引,再搜索出来。用MAPI把邮件读取到数据库里,用SharpICTCLAS做一个lucene的中文的语汇单元分析器,用lucene建立索引及查询索引。 阅读全文
posted @ 2008-05-21 00:23 蛙蛙王子 阅读(2586) 评论(12) 推荐(0) 编辑
摘要:对于四川汶川县的地震,我想大家都很痛心,每个人也都捐款捐物,但咱们做为程序员,也应该为灾区做一些不一样的事情。灾难管理系统是用来在一个国家和地区发生地震、海啸、洪水、恐怖事件、火灾等大灾害的时候用于组织人员救亡,联系组织、匹配捐款、发布避难信息的系统,在平时可能P用没有,但特殊的时候会很有用,比如像这次地震。 国外有开源的灾难管理系统sahana,但是国外的东西不一定符合中国的情况,而且那玩意貌似... 阅读全文
posted @ 2008-05-18 12:19 蛙蛙王子 阅读(3221) 评论(29) 推荐(0) 编辑
摘要:摘要:昨天给大家演示简单的文本聚类,但要给每个聚类再提取一两个关键词用于表示该聚类。我们还是用TFIDF算法来做,因为这是比较简单的提取特征算法,不过这里的TF是指某词在本聚类内所有文章的词频,而不是本文章内出现的次数,IDF还是在所有文章里出现的倒文档频率。 阅读全文
posted @ 2008-05-11 23:34 蛙蛙王子 阅读(8076) 评论(15) 推荐(1) 编辑
摘要:摘要:文本聚类是搜索引擎和语义web的基本技术,这次本蛙和大家一起学习一下简单的文本聚类算法,可能不能直接用于实际应用中,但对于想学搜索技术的初学者还是有一定入门作用的。这里会用到TF/IDF权重,用余弦夹角计算文本相似度,用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识。关于这些概念可以去google,或者参考文本后的参考链接。 阅读全文
posted @ 2008-05-10 20:43 蛙蛙王子 阅读(23712) 评论(51) 推荐(6) 编辑
摘要:摘要:辛辛苦苦写个共享软件,又怕被人破解,所以就会想到用注册码的方式来激活软件。本蛙给大家一个简单的思路来实现软件注册码算法,当然.net做的东西很容易被人破解,反编译出来把验证注册码的代码一去就算破解了,不过咱不讨论这个先。 阅读全文
posted @ 2008-05-03 21:55 蛙蛙王子 阅读(4808) 评论(34) 推荐(0) 编辑
摘要:不知道有多少人去研究google,阿里妈妈的广告作弊算法,抓包、分析http头,分析参数,分析cookies,甚至分析鼠标的点击序列,写钩子用程序去点广告,或者去模仿用户行为,我说这太麻烦了。不管你的广告做的多么好,你的广告点击次和广告商的收益低于一定比例,人家肯定不会给你广告费的,人家又不傻。这里用另一种思路去鼓励你的网站访问者去随机的点击广告,毕竟最终是人点的,咱只是鼓励一下,还不算不道德,是吧。 阅读全文
posted @ 2008-05-01 12:57 蛙蛙王子 阅读(2458) 评论(22) 推荐(0) 编辑

点击右上角即可分享
微信分享提示