随笔分类 -  SQLSERVER

摘要:6. 更多的集成选择 当然,SQL Server 2005的全文检索不是微软平台上的唯一选择,其他主要的全文检索技术如下: (1)Index Server, Indexing Service for Microsoft Windows (2)Microsoft SharePoint™ Portal Server 2001(及后续版本) (3)Micr... 阅读全文
posted @ 2007-12-25 22:51 曹振华 阅读(245) 评论(0) 推荐(0) 编辑
摘要:6. 更多的集成选择 当然,SQL Server 2005的全文检索不是微软平台上的唯一选择,其他主要的全文检索技术如下: (1)Index Server, Indexing Service for Microsoft Windows (2)Microsoft SharePoint™ Portal Server 2001(及后续版本) (3)Micr... 阅读全文
posted @ 2007-12-25 22:50 曹振华 阅读(288) 评论(0) 推荐(0) 编辑
摘要:5.3 磁盘IO 如果平均磁盘等待队列长度多于磁盘头数量的两倍,则磁盘成为瓶颈。主要的解决方法是创建独立于 SQL Server 数据库文件和日志的全文目录。将日志、数据库文件和全文目录分别放在不同的磁盘上。购买运行速度更快的磁盘和使用 RAID 也能帮助改善索引性能。 Catalog Counter ... 阅读全文
posted @ 2007-12-25 22:50 曹振华 阅读(362) 评论(0) 推荐(0) 编辑
摘要:5. 优化SQL Server 2005的全文检索 对于一个企业级的全文检索系统,尤其是笔者上文所设计的多数据中心、异构数据源的全文检索系统,如何在运维过程不断优化系统的执行效率也是很有挑战的工作。由于全文检索过程中不仅涉及大量的IO操作,也存在执行过程中频繁的CPU计算工作,因此这里笔者提供几个关键指标,用于粗略判断系统的关键性能瓶颈。 5.1 CPU ... 阅读全文
posted @ 2007-12-25 22:49 曹振华 阅读(267) 评论(0) 推荐(0) 编辑
摘要:4.3 多个全文检索结果的合并 在完成了上述准备工作后,就可以在应用上设计实际的合并过程了。步骤如下: 1. 在某一城市的客户端发起了一个全文检索的业务查询请求。 2. 查询引擎根据“业务查询登记表”的内容了解如果完成这个请求,需要执行哪个几个具体查询。 3. 查询引擎带着具体查询列表,通过查询“查询的配置表”了解哪些查询是本地的、哪些查询是远程的,... 阅读全文
posted @ 2007-12-25 22:47 曹振华 阅读(236) 评论(0) 推荐(0) 编辑
摘要:如果想要高管要在A城检索全部的人事信息、财务信息、产品信息,根据上面讨论需要增加一系列统一查询结果的配置登记。 1. 链接服务器登记表 ID 编号 Name 名称 From 从 ... 阅读全文
posted @ 2007-12-25 22:46 曹振华 阅读(251) 评论(0) 推荐(0) 编辑
摘要:4.2 多个全文检索结果的前期设计 受到全文检索仅仅支持单个表的限制,每个全文检索的结果相对有限。但是,对于用户而言他们常常做的是一个模糊的关键词在通盘信息中的检索,这些工作应该由开发人员在应用层通过搜索引擎帮助用户进行后台的合并。此外,对于整个政府行业和大型的企业而言,非结构化文本数据和结构化二进制信息资源很可能物理上分散在不同的物理位置上。因此,对于高层的决策者和信息工作者而言,他... 阅读全文
posted @ 2007-12-25 22:46 曹振华 阅读(317) 评论(0) 推荐(0) 编辑
摘要:4. 设计全文检索的统一视图 4.1设计统一的全文检索结果Schema 如果要实现统一的检索视图,第一步要从后端统一检索结果的Schema。笔者这里设计一个简易的Schema,另外预留一个扩展字段,作为各种信息的扩展需要。设计上该扩展字段最好设计为XML类型,因为一方面它是可以进一步扩展的,另一方面它也是结构良好的,可以通过Xpath的索引快速查询。Schema如下: ... 阅读全文
posted @ 2007-12-25 22:45 曹振华 阅读(293) 评论(0) 推荐(0) 编辑
摘要:3.4 引入政府行业或者企业自身的的数据字典 为了让SQL Server 2005的全文检索更适于本政府行业或者企业使用,还需要把自己特色的缩略语、书面替换语进行配置。但是,在此之前,还要把主要使用的语言的相关信息进行配置,主要是配置相关的断字符和干扰字。 SQL Server 2005的断字符配置是根据语言分析规则而异,可以为每个全文索引列指定不同的语言。每种语言的断字符... 阅读全文
posted @ 2007-12-25 22:44 曹振华 阅读(607) 评论(0) 推荐(0) 编辑
摘要:3.3 数据源的规划 SQL Server 2005可以同时支持如下三种数据: (1)Char、Varchar、Nvarchar (2)XML (3)VarBinary(max)、Image 对于第一种,由于都是SQL Server的内置类型,因此数据提取很容易。对于后两种,为了保证Word、Excel、Power Point之类的格式化... 阅读全文
posted @ 2007-12-25 22:43 曹振华 阅读(536) 评论(0) 推荐(0) 编辑
摘要:3. 规划您的全文检索 由于全文检索概念相对较多,与多数读者日常接触的关系数据库查询有所区别,因此上文笔者简单介绍了SQL Server全文检索技术的几个要点,下面笔者介绍一下面对国际化趋势,在本政府或企业的分布式异构信息系统环境下,如何规划全文检索服务的建设。 3.1 全文检索服务的需求收集 抛开其他需求分析内容不谈,仅全文检索服务自身就有很多特定的需求需要明... 阅读全文
posted @ 2007-12-25 22:42 曹振华 阅读(329) 评论(0) 推荐(0) 编辑
摘要:2.2 SQL Server 2005全文检索的技术架构 SQL Server 2005的全文检索其实是由三个进程共同完成的,它们的总体逻辑架构如下: 图2:SQL Server 2005的总体逻辑架构 其中,三个进程分别为: (1)SQL Server process (Sqlservr.exe) (2)Microsoft Full-Text E... 阅读全文
posted @ 2007-12-25 22:41 曹振华 阅读(311) 评论(0) 推荐(0) 编辑
摘要:1,全文搜索背景和技术区别 2,全文检索技术的基本概念 3,SQL Server 2005全文检索的技术架构 4,全文检索服务的需求收集与分析 5,全文搜索数据源规划 6,引入数据字典 7,全文检索结果Schema 8,全文检索结果的前期设计 9,统一查询结果的配置 10, 全文检索结果的合并与展示 11,优化SQL Server 2005的全文检索 12,其他方面的优化因素 13,更多的集成选择 14,检索技术对于检索特性、对象的对照表 阅读全文
posted @ 2007-12-25 22:30 曹振华 阅读(328) 评论(0) 推荐(0) 编辑
摘要:返回组中的项数。COUNT_BIG 的用法与 COUNT 函数类似。两个函数唯一的差别是它们的返回值。COUNT_BIG 始终返回 bigint 数据类型值。COUNT 始终返回 int 数据类型值。后面可能跟随 OVER 子句。 Transact-SQL 语法约定 语法 COUNT_BIG ( { [ ALL | DISTINCT ] expression } | * ) ... 阅读全文
posted @ 2007-12-25 22:09 曹振华 阅读(644) 评论(0) 推荐(0) 编辑
摘要:返回组中的项数。COUNT 与 COUNT_BIG 函数类似。两个函数唯一的差别是它们的返回值。COUNT 始终返回 int 数据类型值。COUNT_BIG 始终返回 bigint 数据类型值。后面可以跟 OVER 子句。 Transact-SQL 语法约定 语法 COUNT ( { [ [ ALL | DISTINCT ] expression ] | * } ) ... 阅读全文
posted @ 2007-12-25 22:07 曹振华 阅读(696) 评论(0) 推荐(0) 编辑
摘要:返回大于或等于指定数值表达式的最小整数。 Transact-SQL 语法约定 语法 CEILING ( numeric_expression ) 参数 numeric_expression 是精确数字或近似数字数据类型类别(bit 数据类型除外)的表达式。 返回类型 返回与 numeric_expression 相同的类型。 示例 ... 阅读全文
posted @ 2007-12-22 10:11 曹振华 阅读(745) 评论(0) 推荐(0) 编辑
摘要:将一种数据类型的表达式显式转换为另一种数据类型的表达式。CAST 和 CONVERT 提供相似的功能。 Transact-SQL 语法约定 语法 Syntax for CAST: CAST ( expression AS data_type [ (length ) ]) Syntax for CONVERT: CONVERT ( data_type [ ( length ) ]... 阅读全文
posted @ 2007-12-22 10:10 曹振华 阅读(2824) 评论(0) 推荐(0) 编辑
摘要:计算条件列表并返回多个可能结果表达式之一。 CASE 具有两种格式: 简单 CASE 函数将某个表达式与一组简单表达式进行比较以确定结果。 CASE 搜索函数计算一组布尔表达式以确定结果。 两种格式都支持可选的 ELSE 参数。 Transact-SQL 语法约定 语法 Simple CASE function: CASE input_expres... 阅读全文
posted @ 2007-12-22 10:09 曹振华 阅读(645) 评论(0) 推荐(0) 编辑
摘要:以用户指定的格式将数据文件导入数据库表或视图。 Transact-SQL 语法约定 语法 BULK INSERT [ database_name . [ schema_name ] . | schema_name . ] [ table_name | view_name ] FROM 'data_file' [ WITH ( ... 阅读全文
posted @ 2007-12-22 10:08 曹振华 阅读(3405) 评论(0) 推荐(0) 编辑
摘要:可以取值为 1、0 或 NULL 的整数数据类型。 备注 Microsoft SQL Server 2005 数据库引擎 优化了 bit 列的存储。如果表中的列为 8 bit 或更少,则这些列作为 1 个字节存储。如果列为 9 到 16 bit,则这些列作为 2 个字节存储,以此类推。 字符串值 TRUE 和 FALSE 可以转换为以下 bit 值:TRUE 转换为 1,FALSE 转换... 阅读全文
posted @ 2007-12-22 10:07 曹振华 阅读(663) 评论(0) 推荐(0) 编辑