网络编程 | 站长之家 | 网页制作 | 图形图象 | 操作系统 | 冲浪宝典 | 软件教学 | 网络办公 | 邮件系统 | 网络安全 | 认证考试 | 系统进程
Firefox | IE | Maxthon | 迅雷 | 电驴 | BitComet | FlashGet | QQ | QQ空间 | Vista | 输入法 | Ghost | Word | Excel | wps | Powerpoint
asp | .net | php | jsp | Sql | c# | Ajax | xml | Dreamweaver | FrontPages | Javascript | css | photoshop | fireworks | Flash | Cad | Discuz!
当前位置 > 网站建设学院 > 网络编程 > 数据库 > SQL技巧
Tag:注入,存储过程,分页,安全,优化,xmlhttp,fso,jmail,application,session,防盗链,stream,无组件,组件,md5,乱码,缓存,加密,验证码,算法,cookies,ubb,正则表达式,水印,索引,日志,压缩,base64,url重写,上传,控件,Web.config,JDBC,函数,内存,PDF,迁移,结构,破解,编译,配置,进程,分词,IIS,Apache,Tomcat,phpmyadmin,Gzip,触发器,socket
网络编程:ASP教程,ASP.NET教程,PHP教程,JSP教程,C#教程,数据库,XML教程,Ajax,Java,Perl,Shell,VB教程,Delphi,C/C++教程,软件工程,J2EE/J2ME,移动开发
数据库:数据库教程,数据库技巧,Oracle教程,MySQL教程,Sybase教程,Access教程,DB2教程,数据库安全,数据库文摘
本月文章推荐
.MS SQL数据库备份和恢复存储过程.
.SQL语句导入导出大全.
.诊断全局错误时如何在系统级进行.
.SQL Server 2005使用基于行版本控.
.利用视图管理器编写高效 SQL SEL.
.将一个表分开导出成不同文件的实.
.在SQL Server 2005数据库中更改数.
.数据库的数据挖掘概述(二).
.如何让你的SQL运行得更快.
.解读SQL Server2008的新语句MERGE.
.SQL Server端口更改后的数据库连.
.SQL Server中单引号的两种处理技.
.在SQL Server 2005中用存储过程实.
.利用数据库日志恢复数据到时间点.
.一次大批量数据备份和导入工作.
.一個Select出一個表中第N條記錄的.
.SQL Server2000数据库文件损坏时.
.sql server 2000中循环插入100万.
.利用UltraEdit快速将SQL语句转换.
.用存储过程几个最直接的好处.

深入探讨SQL Server 2005噪声字词和辞典

发表日期:2008-6-11


这篇论坛文章(赛迪网技术社区)详细介绍了SQL Server 2005噪声字词和辞典的相关概念及背景知识,更多内容请参考下文:

问题:

我听说全文搜索可以使用噪声字词来消除搜索过程中无意义的字词。我还听说全文搜索利用了辞典,但是不是很清楚实际是如何应用的。你可不可以详细介绍这两种技术是怎么样应用到全文搜索中的?我很想知道这些全文搜索技术的背景知识,以及哪里可以获取这些文件和如何升级这些文件。

解答:

尽管噪声字词和辞典在全文搜索执行方面有很多相似的地方,但是为了解释的更为清楚,我们把这两种技术分开来讲。要记住虽然SQL Server 2000和7.0版本也有一些相同的属性,但是本文中介绍的信息都适用于SQL Server 2005。你还需要关注SQL Server 2008的全文搜索功能的特点,因为新版本中部分规则有所变动。

噪声字词

目的:

microsoft建立噪声字词文件,在语言的基础上决定哪些字词对于搜索来说是无意义的。例如,在(美式)英语中,噪声字词可以包括:because、been、before、being、between、both、but等。在默认的Noiseenu.txt文件(美式英语)里,有100多个噪声字词,在进行全文搜索的时候会使用这个文件消除无意义的字词。

语言支持:

系统支持20种不同的语言,从中文(Noisechs.txt)到土耳其语(Noisetrk.txt)。

windows 目录:$SQL_Server_Install_Path\Microsoft sql server\MSSQL.1\MSSQL\FTDATA\

更改:

可以向文件里添加新的噪声字词。新噪声字词会添加到默认的最后一次登录“your”后之后。

更多信息

如果你更改了噪声字词文件,在使用新噪声字词前,需要重新输入所有的全文目录。

辞典

目的:

能够在全文搜索中确定并使用同义字词。利用CONTAINS或CONTAINSTABLE命令指定FORMSOF THESAURUS参数,就可以使用辞典来确定搜索关键词的同义词。同样也可以利用FREETEXT和FREETEXTTABLE命令。利用这些命令可以使用辞典来确定搜索关键词的表达或替换词。

语言支持:

辞典文件为XML格式文件,有一个总文件(tsGLOBAL.xml)和18个语言文件。默认设置中所有的文件都有注释的XML样例,因此在执行全文搜索时默认设置是不会建立同义词的。

Windows目录:

$SQL_Server_Install_Path\Microsoft sql server\MSSQL.1\MSSQL\FTDATA\

更改:

在检查了XML格式之后,存在两种辞典词目类型。第一类为扩展类型,第二类为替代类型。扩展类型可以被认为时同义词或替代词。替代类型表明以一个字符串替代另一个字符串。

更多信息:

所有辞典文件都应该以Unicode形式保存。

要使用新的辞典,需要重新启动全文搜索引擎窗口。

上一篇:如何将数据仓库与系统体系结构合成一体 人气:848
下一篇:Microsoft SQL Server事务日志的应用 人气:997
浏览全部SQL Server 2005的内容 Dreamweaver插件下载 网页广告代码 祝你圣诞节快乐 2009年新年快乐