仅显示标题浏览

Bati's eHome of Tech

  :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: :: 管理 ::

2008年4月11日

摘要: 1、iis中配置php 所有网站-ISAPI筛选器下面添加php5isapi.dll,所有网站-主目录-配置-映射下面添加php扩展,可执行文件仍然指向php5isapi.dll。 2、mysql中执行sql脚本文件 利用命令source c:\table.sql。 3.第一次访问首页出现访问数据库错误 原因:字符集问题. 解决:打开includes\Database.php,找到数据库查询子函... 阅读全文
posted @ 2008-04-11 22:08 Bati 阅读(259) 评论(1) 推荐(0) 编辑

摘要: Learning with Kernels 关于统计学习理论,Kernel和SVM的综合性教材,论述比较深广 Applied Multivariate Statistical Analysis (5th Ed.) 多元统计分析的一本很好的教材 Statistical Pattern Recognition 关于与模式识别有关的统计学习方法的全面综述 Pattern Classification (... 阅读全文
posted @ 2008-04-11 20:43 Bati 阅读(725) 评论(0) 推荐(0) 编辑

摘要: 1. 你们的项目组使用源代码管理工具了么? 应该用。VSS、CVS、PVCS、ClearCase、CCC/Harvest、FireFly都可以。我的选择是VSS。 2. 你们的项目组使用缺陷管理系统了么? 应该用。ClearQuest太复杂,我的推荐是BugZilla。 3. 你们的测试组还在用Word写测试用例么? 不要用Word写测试用例(Test Case)。应该用一个专门的系统,可以是Te... 阅读全文
posted @ 2008-04-11 20:38 Bati 阅读(294) 评论(0) 推荐(0) 编辑

摘要: 原文作者:aihorizon.com原文链接: Machine Learning, Part III: Testing Algorithms, and The "No Free译者:commondata ·测试机器学习算法 现在你对机器学习算法的分类已经有了一个大体的了解,但在更进一步了解每个算法的细节之前,你还需要对如何测试机器学习算法有一个大体的认识。 在大多数情况下,将会出现以下三类数据:训... 阅读全文
posted @ 2008-04-11 20:32 Bati 阅读(2762) 评论(0) 推荐(0) 编辑

摘要: 原文作者:aihorizon.com原文链接: Machine Learning, Part I: Supervised and Unsupervised Learning译者:commondata 上次我们讨论了基于结果的两类学习。这篇文章我们将关注一些其他方面的学习:监督还是无监督。当训练用例被标记了正确结果的时候,监督学习方式为怎样改进学习给出一个反馈。这类似于教官教导某个Agent,它的... 阅读全文
posted @ 2008-04-11 20:31 Bati 阅读(18582) 评论(0) 推荐(1) 编辑

摘要: 原文作者:不祥原文链接: Machine Learning, Part I: Types of Learning Problems译者:commondata 在开始学习各种不同类型的机器学习算法之前,首先了解一下背景材料是很有帮助的。它们包括各种算法的执行目标是什么,以及它们适用于人工智能领域的哪些方面。这篇文章将涵盖通常的人工智能研究中的各种学习类型,为每种学习方式提供Example,并且我将尝... 阅读全文
posted @ 2008-04-11 20:30 Bati 阅读(2676) 评论(1) 推荐(2) 编辑

摘要: 原文链接: http://hideto.javaeye.com/blog/130815 原文:Google Architecture Google是伸缩性的王者。Google一直的目标就是构建高性能高伸缩性的基础组织来支持它们的产品。 平台Linux大量语言:Python,Java,C++ 状态在2006年大约有450,000台廉价服务器在2005年Google索引了80亿Web页面,现在... 阅读全文
posted @ 2008-04-11 20:27 Bati 阅读(477) 评论(0) 推荐(0) 编辑

摘要: 前言 信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、yisou、中搜等大型搜索引擎一直人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。 搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvist... 阅读全文
posted @ 2008-04-11 20:08 Bati 阅读(353) 评论(0) 推荐(0) 编辑

摘要: 随着“眼球经济”席卷互联网,成千上万的资金迅速流向最能吸引浏览着眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期,成为了未来几年内最具发展潜力的产业之一。随着Google、百度、中国搜索等各具特色的搜索引擎逐渐成为人们最常用的网络工具,企业对搜索引擎的注意力也从“观察”升级为“动武”。 随着市场容量和使用者人数的不断激增,如何完善搜索功能使之更加公平、公开、标准和人性化也就随之成为... 阅读全文
posted @ 2008-04-11 20:08 Bati 阅读(821) 评论(0) 推荐(0) 编辑

摘要: 随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为学者,会把有代表性的搜索引擎作为研究对象…… 而作为一个网站的经营者,其更关心的或许是如何通过网络载体让更多的网民知道自己的网站,进而获得更高的流量和知名度。这其中,搜索引擎已经成了一... 阅读全文
posted @ 2008-04-11 20:07 Bati 阅读(1150) 评论(0) 推荐(0) 编辑

摘要: 互联网发展的今天,一方面离不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥有大量书籍资料的图书馆,到了今天你怎么想?或许今天的很多人都会选择一种更方便、快捷、全面、准确的方式——互联网。你可以坐在家里轻点几下鼠标就查到想要的各类信息,这在互联网没有被普及之前,还都仅是一个梦而已,但如今这一切已成为了可能... 阅读全文
posted @ 2008-04-11 20:06 Bati 阅读(405) 评论(0) 推荐(0) 编辑

摘要: Journals ACM TKDD http://tkdd.cs.uiuc.edu/DMKD http://www.springerlink.com/content/1573-756X/?p=859c3e83455d41679ef1be783e923d1d&pi=0IEEE TKDE http://www.ieee.org/organizations/pubs/transacti... 阅读全文
posted @ 2008-04-11 20:04 Bati 阅读(810) 评论(0) 推荐(0) 编辑

摘要: Machine Learning 大家(1):M. I. Jordan (http://www.cs.berkeley.edu/~jordan/) 在我的眼里,M Jordan无疑是武林中的泰山北斗。他师出MIT,现在在berkeley坐镇一方,在附近的两所名校(加stanford)中都可以说无出其右者, stanford的Daphne Koller虽然也声名遐迩,但是和Jordan比还是有一段距... 阅读全文
posted @ 2008-04-11 20:02 Bati 阅读(398) 评论(0) 推荐(0) 编辑

摘要: 以下工具绝大多数都是开源的,基于GPL、Apache等开源协议,使用时请仔细阅读各工具的license statementI. Information Retrieval1. Lemur/IndriThe Lemur Toolkit for Language Modeling and Information Retrievalhttp://www.lemurproject.org/Indri:Le... 阅读全文
posted @ 2008-04-11 19:59 Bati 阅读(1286) 评论(0) 推荐(0) 编辑

摘要: 感觉数学似乎总是不够的。这些日子为了解决research中的一些问题,又在图书馆捧起了数学的教科书。 从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识。Learning和Vision都是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说,往往是非常exciting的enjoyable的事情。不过,这也代表着要充分了解这个领... 阅读全文
posted @ 2008-04-11 19:36 Bati 阅读(583) 评论(0) 推荐(0) 编辑

摘要: 一、搜索引擎技术/动态资源、综合类1、卢亮的搜索引擎研究 http://www.wespoke.com/卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。2、laolu'blog 有不少来自国外的关于搜索引擎方面的资料,偏重于资料和数... 阅读全文
posted @ 2008-04-11 19:33 Bati 阅读(502) 评论(0) 推荐(0) 编辑

摘要: 按语:几天前本博从新语丝上转贴了邹承鲁先生关于如何培养研究生的文章。今天,长刚向我推荐了这篇,我看了一遍觉得有意思。我决定转贴该文,因为邹先生的主要针对老师、针对自然科学领域,而王先生这篇则针对面向学生,针对的是人文学科而言的,两者形成很好的互补。 这个题目我非常喜欢,因为这个题目,对大家多少都有实际的帮助。如果下次我必须再登台演讲,我觉得这个题目还可以再发挥一两次。我是台大历史研究所毕业的,所以... 阅读全文
posted @ 2008-04-11 19:20 Bati 阅读(244) 评论(0) 推荐(0) 编辑

摘要: 关于学术价值的评价,不同的人,不同的时期会有不同的理解。我想,做过paper的朋友可能都有这样的经历:reviewer完全不屑于自己的工作。很多人都对于这种“低水平”的reviewer义愤填膺。这更多是源于背景差异导致的价值取向的不同。一项工作的意义,主要是下面一些方面 新的理论,新的模型 新的系统设计,或者新的应用形式 实验性能的提高,更快,更准,或者更可靠。 理论背景的人,通常喜欢第一... 阅读全文
posted @ 2008-04-11 19:14 Bati 阅读(690) 评论(0) 推荐(0) 编辑

摘要: Multidimensional Scaling 多维标度 ms是用来降低向量空间维度的,一般是降低到二维,降低的过程中要尽量保证各个向量之间的距离在许可范围之内保持相对不变。 可以很形象的把ms的方法用特殊的作用力方式来说明。 首先还是要计算出n维向量空间里面各个向量的距离作为标准距离。 然后把向量看作在二维平面里的一个个粒子,开始的时候粒子的分布是随机的。 粒子之间有引力和斥力。当两... 阅读全文
posted @ 2008-04-11 19:10 Bati 阅读(330) 评论(0) 推荐(0) 编辑

摘要: Optimization 优化 PCI里面介绍了两个算法:simulated annealing,模拟退火和genetic algorithms,遗传算法。 无论哪种优化算法,这里都需要一个代价计算函数来判定计算过程中产生的结果的好坏。 sa要设置一个较高的初始温度,按照由快变慢的速度在迭代过程中降温。 算法是同一个随机结果开始,在解向量空间的某一维度上做一个小的随机变化而生成一个新的解。... 阅读全文
posted @ 2008-04-11 19:10 Bati 阅读(247) 评论(0) 推荐(0) 编辑