仅显示标题浏览

Bati's eHome of Tech

  :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: :: 管理 ::

2008年4月14日

摘要: Google公司今天宣布,其Googlebot web信息采集系统将开始自动填写HTML表单,并记录反馈结果。 Google搜索引擎似乎在不顾一切的吞食来自互联网的数据,仅去年1年它就吞下了约100 Exabytes(1 Exabyte=1000000000 Gigabyte)的数据。之前Google并不触及大量的深层页面(也就是网站中被隐藏的内容,例如没有连接的页面,非文本的内容,或是动态内容返... 阅读全文
posted @ 2008-04-14 08:49 Bati 阅读(196) 评论(0) 推荐(0) 编辑

2008年4月11日

摘要: 1、iis中配置php 所有网站-ISAPI筛选器下面添加php5isapi.dll,所有网站-主目录-配置-映射下面添加php扩展,可执行文件仍然指向php5isapi.dll。 2、mysql中执行sql脚本文件 利用命令source c:\table.sql。 3.第一次访问首页出现访问数据库错误 原因:字符集问题. 解决:打开includes\Database.php,找到数据库查询子函... 阅读全文
posted @ 2008-04-11 22:08 Bati 阅读(259) 评论(1) 推荐(0) 编辑

摘要: Learning with Kernels 关于统计学习理论,Kernel和SVM的综合性教材,论述比较深广 Applied Multivariate Statistical Analysis (5th Ed.) 多元统计分析的一本很好的教材 Statistical Pattern Recognition 关于与模式识别有关的统计学习方法的全面综述 Pattern Classification (... 阅读全文
posted @ 2008-04-11 20:43 Bati 阅读(725) 评论(0) 推荐(0) 编辑

摘要: 1. 你们的项目组使用源代码管理工具了么? 应该用。VSS、CVS、PVCS、ClearCase、CCC/Harvest、FireFly都可以。我的选择是VSS。 2. 你们的项目组使用缺陷管理系统了么? 应该用。ClearQuest太复杂,我的推荐是BugZilla。 3. 你们的测试组还在用Word写测试用例么? 不要用Word写测试用例(Test Case)。应该用一个专门的系统,可以是Te... 阅读全文
posted @ 2008-04-11 20:38 Bati 阅读(294) 评论(0) 推荐(0) 编辑

摘要: 原文作者:aihorizon.com原文链接: Machine Learning, Part III: Testing Algorithms, and The "No Free译者:commondata ·测试机器学习算法 现在你对机器学习算法的分类已经有了一个大体的了解,但在更进一步了解每个算法的细节之前,你还需要对如何测试机器学习算法有一个大体的认识。 在大多数情况下,将会出现以下三类数据:训... 阅读全文
posted @ 2008-04-11 20:32 Bati 阅读(2762) 评论(0) 推荐(0) 编辑

摘要: 原文作者:aihorizon.com原文链接: Machine Learning, Part I: Supervised and Unsupervised Learning译者:commondata 上次我们讨论了基于结果的两类学习。这篇文章我们将关注一些其他方面的学习:监督还是无监督。当训练用例被标记了正确结果的时候,监督学习方式为怎样改进学习给出一个反馈。这类似于教官教导某个Agent,它的... 阅读全文
posted @ 2008-04-11 20:31 Bati 阅读(18582) 评论(0) 推荐(1) 编辑

摘要: 原文作者:不祥原文链接: Machine Learning, Part I: Types of Learning Problems译者:commondata 在开始学习各种不同类型的机器学习算法之前,首先了解一下背景材料是很有帮助的。它们包括各种算法的执行目标是什么,以及它们适用于人工智能领域的哪些方面。这篇文章将涵盖通常的人工智能研究中的各种学习类型,为每种学习方式提供Example,并且我将尝... 阅读全文
posted @ 2008-04-11 20:30 Bati 阅读(2676) 评论(1) 推荐(2) 编辑

摘要: 原文链接: http://hideto.javaeye.com/blog/130815 原文:Google Architecture Google是伸缩性的王者。Google一直的目标就是构建高性能高伸缩性的基础组织来支持它们的产品。 平台Linux大量语言:Python,Java,C++ 状态在2006年大约有450,000台廉价服务器在2005年Google索引了80亿Web页面,现在... 阅读全文
posted @ 2008-04-11 20:27 Bati 阅读(477) 评论(0) 推荐(0) 编辑

摘要: 随着“眼球经济”席卷互联网,成千上万的资金迅速流向最能吸引浏览着眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期,成为了未来几年内最具发展潜力的产业之一。随着Google、百度、中国搜索等各具特色的搜索引擎逐渐成为人们最常用的网络工具,企业对搜索引擎的注意力也从“观察”升级为“动武”。 随着市场容量和使用者人数的不断激增,如何完善搜索功能使之更加公平、公开、标准和人性化也就随之成为... 阅读全文
posted @ 2008-04-11 20:08 Bati 阅读(821) 评论(0) 推荐(0) 编辑

摘要: 前言 信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、yisou、中搜等大型搜索引擎一直人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。 搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvist... 阅读全文
posted @ 2008-04-11 20:08 Bati 阅读(353) 评论(0) 推荐(0) 编辑