一、中文数据库系统的检索功能
从学科类目和期刊名称途径的导航查询功能,有简单的初级检索方式和复合检索方式等。
在复合检索中只需一次性地输入逻辑组配式就能完整地表达各种主题内容。另外在检索输入框的右侧还提供了“模糊”和“精确”检索方式的可选项便于进行更灵活的搜索以实现扩检与缩检的调节。
二、检索的语法规则
几乎在所有的搜索引擎中都将布尔逻辑操作符作为最基本的语法规则。一般布尔逻辑操作符包括NOT、AND、OR和括号。NOT表示逻辑“非”使用NOT寻找包含NOT前的关键词但排除NOT后的关键词的文档;AND表示逻辑“与”使用AND操作符检索所得的文档中包含所有的关键字;OR表示逻辑“或”使用OR将检索出几个关键字中至少包含一个的文档;括号的作用和数字中的括号相似可用来使括在其中的操作符先起作用。
以上四种操作符可互相结合使用但有一定的执行先后次序其优先顺序依次为:括号、NOT、AND、OR。不同的搜索引擎对逻辑检索支持的程度不同有的是完全支持有的仅部分支持。
1.符号的使用
逗号:其作用类似于OR不同的是查询结果按包含的关键词的多少排列包含的关键词越多文档的位置越靠前。
空格:其作用类似于AND。
通配符“∗”和“?”:“∗”代替任意一个字母“?”代替一个任意的字母通配符不能放在单词的开头或中间。
“+、-号”:在一个关键词前不留空格地加上一个“+”号表示该关键词一定要出现在检索结果。“-”号的情况正好相反表示该关键词一定不会出现在结果中。
2.截词检索
指利用不完整的词或词根进行的检索可提高查全率扩大检索范围但相应地准确率会降低。绝大多数网络检索工具都支持截词检索一般是指右截词部分支持中间截词有的需要使用通配符如“∗”等。
3.字符串检索
也叫词组检索将一个字符串当作一个独立运算单元进行严格匹配以提高检索的精度和准确度。字符串检索不仅规定了检索式中各个具体的检索词及其相互间的逻辑关系而且规定了检索词之间的临近位置关系。几乎所有的搜索引擎都支持字符串检索并且都用双引号(“”)来代表字符串。
4.字段检索
虽然网络信息实际上不分字段但以万维网为用户界面的网络信息检索工具设计了类似于字段检索的功能。字段检索一律表现为前缀符的限制形式如主题字段限制的有“Title:”、“Keywords:”等非主题字段限制的有“im-age:”等另外还有主机名限制(host:)、link限制(link:)、URL限制(URL)等诸多类型这些字段限制功能限定了检索词在数据库记录中出现的位置可用来控制检索结果的相关性。
5.检索范围限制在某一范围中检索指定的关键词可提高检索的准确性。包括几种类型:
分类范围:在某一类型中检索。
地域范围:在某一地区中检索。
时间范围:检索某一时间范围内建立的网站或编写的网页。
信息来源限制:在某一类型的网站中检索。
检索词位置限制:提供检索词必须出现在网址或是网页或其它位置的限制。另外还有一些特殊范围的限定如域名后缀(com、gov、org等)、文件类型(文本、图形、声音等)。
6.自然语言检索
直接采用自然语言中的字、词或整个句子作提问式进行检索也叫问题检索。这种方式使检索变得简单而直接不必依赖于专门的检索语言这正是网络检索工具优于传统检索工具之处使得非情报专业的用户不用经过专深的检索语言学习即能进行检索活动。几乎所有的搜索引擎都支持自然语言检索但有其利亦有其弊由于自然语言不加控制用词灵活容易产生检索范围失控现象。
7.概念检索
即用某一检索词进行检索时能同时对该词同样或类似概念的词如同义词、近义词、广义词、狭义词进行检索以达到扩大检索避免漏检的目的。
8.区分大小写检索
大小写有别是英文等西方文字中的一个特点。在查找西文信息时区分大小写这一检索特性有助于提高查准率尤其有助于对专有名词的查询。
9.模糊检索
即允许被检索信息和检索提问之间存在一定的差异这些差异往往来自用户的输入错误如少键入一个字;另一种差异来自某些词汇在不同国家的不同形式。目前的网络信息检索工具还只能进行纠正输入错误的模糊检索。
三、检索策略的设计
关键词检索是信息检索的主要方法。首先对检索课题进行主题分析选取一些对揭示和描述主题内容起主要作用的关键性词语作为检索词然后用来对中文数据库题(篇)名字段进行摸底检索。检索词(式)在题(篇)名字段命中的文献通常是比较切题的;此时再逐篇浏览命中文献的题(篇)名和关键词(也可包括文摘)了解专业用词习惯和标引用词规律选取有用的同义词、近义词及专业术语的不同表达形式作为相关检索词补充到提问式中然后再作进一步地试检、筛选如此循环直至选全、选准各种检索用词。
在课题的检索中可将专业术语拆分然后进行合理的逻辑组配以满足多样化的专业术语表达形式然后指定在同一字段搜索以提高检索的专指性。如,某用户查找“德国民主社会主义及其政党研究”方面的文献通过试检浏览了解到与“民主社会主义”相关的内容应包括下列关键词:民主社会主义、社会民主主义、新保守主义、新自由主义。所涉及的“政党”应列出所有的全称和简称:社民党(德国社会民主党)、民社党(民主社会主义党)和基民盟(基督教民主联盟又简称基民党)。采用知网的全文检索功能检索提问式为“(民主社会主义OR社会民主主义OR新保守主义OR新自由主义)AND(社民党OR社会民主党OR民社党OR民主社会主义党OR基民盟OR基督教民主联盟OR基民党)AND德国”(根据系统的功能该式需分步组配完成)并指定按相关度排序最终获得相关文献。
四、检索技巧总结
1.选择合适的检索工具,不同的检索工具有不同的特点。细节查询或强调获取较为具体、特定的信息时一般应利用关键词进行大范围的快速检索方便、快捷地查询到针对性较强的检索结果。
2.一般性的浏览查询或强调获取较为综合、准确的信息时一般应利用分类检索用户可按思维的逻辑顺序或按照其主题目录体系的导引去浏览、追踪、查找信息。
3.选择合适的检索词为了提高检索的精度应尽量选专指词、特定概念或非常用词避免普通词、泛指概念;而当检索结果数量太少需扩大检索范围时要使用同义词、近义词。
4.几乎所有的搜索引擎都提供“对搜索结果按相关性大小排序”的功能但有时排列第一的结果未必是“最好”的结果。一次成功的搜索也经常是由好几次搜索组成的。可先用简单的关键词测试从搜索结果页面里寻找更多的信息再设计一个更好的关键词重新搜索。