05 2013 档案
TF-IDF算法概念
摘要:TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,因特网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果中出现的顺序。 TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,. 阅读全文
posted @ 2013-05-30 14:13 叮叮猫的编程世界 阅读(421) 评论(0) 推荐(0) 编辑
数据库性能优化详解
摘要:数据库性能优化详解性能调节的目的是通过将网络流通、磁盘 I/O和 CPU时间减到最小,使每个查询的响应时间最短并最大限度地提高整个数据库服务器的吞吐量。为达到此目的,需要了解应用程序的需求和数据的逻辑和物理结构,并在相互冲突的数据库使用之间(如联机事务处理 (OLTP)与决策支持)权衡。对性能问题的考虑应贯穿于开发阶段的全过程,不应只在最后实现系统时才考虑性能问题。许多使性能得到显著提高的性能事宜可通过开始时仔细设计得以实现。为最有效地优化 Microsoft® SQL Server™ 2000 的性能,必须在极为多样化的情形中识别出会使性能提升最多的区域,并对这些区域集中分析。虽然 阅读全文
posted @ 2013-05-28 11:07 叮叮猫的编程世界 阅读(354) 评论(0) 推荐(0) 编辑
将DataTable作为存储过程参数的用法
摘要:比较新奇的用法。最近工作中写了几个存储过程,需要向存储过程中传递字符串,因为SQL Server 2000中没有内置类似于 split 的函数,只好自己处理,将前台数据集中的一列用逗号拆分存到一个List<string>中,再转化为字符串传给存储过程,很是麻烦。今天看了下SQL Server 2008的新特性,发现有表变量的使用,及其将DataTable作为参数的用法,就尝试了一下,简单谈谈心得。示例代码下载一、测试环境1、Windows Server 2008 R2 DataCenter2、Visual Studio 2008Team SystemWith SP13、SQL Se 阅读全文
posted @ 2013-05-28 10:55 叮叮猫的编程世界 阅读(316) 评论(0) 推荐(0) 编辑
WEB网站架构设计
摘要:这篇文章是我看到以后转过来的1 - Web负载均衡 1.1 - 使用商业硬件实现 最常用的F5 与citrix netscaler。比如12306前端的web好像用的就是F5 的BIGIP。如果公司资金足够的话,相对使用开源软件来说理方便。优点:维护方便,性能稳定 缺点:费用太高 1.2 - 使用开源软件 可选择使用lvs或者nginx做web应用的负载均衡。 Lvs工作在tcp 协议4层下,而nginx工作在tcp协议7层下。4层和7层差别举个实际例子:member.app.com,shop.app.com域名对外只有一 个ip,通过lvs指向后台10.0.0.1-10.0.0.10 这10 阅读全文
posted @ 2013-05-23 16:49 叮叮猫的编程世界 阅读(277) 评论(0) 推荐(0) 编辑


点击右上角即可分享
微信分享提示