万方数据库中高级检索中的精确与模糊有什么区别

来源:论文 时间:2016-07-22 11:05:44 阅读:

【www.zhuodaoren.com--论文】

万方数据库中高级检索中的精确与模糊有什么区别(一)
万方学位论文高级检索帮助

万方学位论文高级检索帮助

"命令检索"也被称为"高级检索",点击检索入口页面的"命令检索"或"高级检索"链接,即可进入“图1”所示命令检索入口页面。

命令检索支持布尔检索、相邻检索、截断检索、同字段检索、同句检索和位置检索等全文检索技术,具有较高的查全率和查准率。

在“中国学位论文全文数据库”中,可供检索的字段有:论文题名( 200)、作者( 300)、作者专业( 720)、导师姓名(380)、授予学位(700)、授予单位(303)、授予时间(440)、分类号(610)、关键词(620)、文摘(600);支持“精确匹配”检索的字段有:作者( 300)、作者专业( 720)、导师姓名(380)、授予学位(700)、授予单位( 303)、分类号(610)、关键词(620)。在按“(中图)分类号”检索此库时,既可输入一个完整的分类号,也可只输入此分类号的前半部分。

检索表达式书写规则:

需要特别说明的是:在本系统检索表达式中,除要检索的词可以用全角符号外,各种运算符号($./^*+与圆括号、空格)只能是半角符号。对西文字母,在检索时不区分大小写。

① 检索表达式说明: 计算机 检索含有检索词“计算机”的记录

计算机*北京 检索同时含有检索词“计算机”和“北京”的记录

计算机+北京 检索含有检索词“计算机”或“北京”的记录

计算机/(60) 检索字段60中含有检索词“计算机” 的记录

计算机 (G) 北京 检索同一字段中既含“计算机”又含有“北京”的记录。注意:在运算符“(G)”与其前后检索词之间,应有一个空格。

张$ 右截断检索,以“张”字开始的记录字段值。右截断检索比较耗费服务器资源,建议不要采用太宽泛的词进行右截断检索。

镜像服务系统所提供的检索语言,以布尔代数为基础,可方便、灵活地表达您的检索要求。 ② 匹配方式选择-模糊配匹、精确匹配与前方一致

1、“模糊匹配”检索

“模糊匹配”是指:无论词的位置怎样,只要出现该词即可;即只要一记录的指定字段中含有此检索词,便认为此记录符合此检索要求。如限定在“题名”字段检索“基因”,则所有“题名”中含有“基因”一词的记录为检索命中记录。

对一检索词,若要进行“模糊匹配”检索,请直接输入此检索词。“模糊匹配”检索是最常见的检索请求。

2、“精确匹配”检索

“精确匹配”则要求字段的取值与检索词完全相同。例如:“智能设计”与“设计”是“模糊匹配”,但不是“精确匹配”;“李红”与“李红军”是“模糊匹配”,但不是“精确匹配”;“国有企业”与“公司治理与国有企业改革”是“模糊匹配”,但不是“精确匹配”。

若要进行“精确匹配”检索,请将此检索词用半角双引号(")引起来。

对一数据库,并不是所有可检索字段均支持“精确匹配”检索,一字段是否支持“精确匹配”检索依赖于其索引策略。【万方数据库中高级检索中的精确与模糊有什么区别】

3、“前方一致匹配”检索(即右截断检索)

“前方一致匹配”是指:只有整个字段前部分(从第一个字符开始)与检索词相同才进行匹配。

由于某种原因,用户可能并不知某一检索词的精确拼写法,而只知道一个词根。这种情况下,用户只需给出一个检索词词根,而不必给出一个确定的检索词。右截断检索词用在词根后紧跟一个“$"符来标识。

与精确检索词一样,如果词根包含了括号,任一逻辑运算符或以数字符号(#)开始,则也必须用双引号("")括起来。

比如:假设一数据库的检索词词表中含有下面一些词:

FILE ORGANIZATION

FILM

FILM INDUSTRY

FILM MAKER

FILM MAKING

那么:Film$ 等价于 FILM + FILM INDUSTRY + FILM MAKER + FILM MAKING

FILM M$ 等价于 FILM MAKER + FILM MAKING

4、检索实例

例如:“中国学位论文全文数据库”中支持“精确匹配”检索的字段有:作者( 300)、作者专业( 720)、导师姓名(380)、授予学位(700)、授予单位( 303)、分类号(610)、关键词(620),对于此库可进行如下检索:

1、纳米/(200,620) “模糊匹配”检索要求。对一记录,只要其题名或一关键词中含有“纳米”这一字符串,此记录便符合此检索要求。

2、"纳米"/(620) “精确匹配”检索要求。对一记录,只有它的某一关键词为“纳米”,此记录才符合此检索要求。对仅有“珍珠”、“纳米粉体”两个关键词的论文,用“纳米/(620)”可以检索出来,但用"纳米"/(620)则检索不出来。

3、[HIV-1]/(620)^"HIV-1"/(620) 此检索式的含意是:查找此库中“关键词”中含有“HIV-1”,但没有关键词为“HIV-1”的记录。

4、Econom$/(200) 此检索式的含意是:查找出此库“题名”中含有以“Econom”开始的西文单词的记录。一记录的“题名”中只含有以“Econom”开始的词,如Economize、Economic、Economy等,此记录便符合检索要求。

③ 逻辑运算符:

我们可以利用逻辑运算符把两个或两个以上的检索要求连接起来,形成更复杂的检索要求。基本的逻辑运算符有三个OR、AND和 NOT。在本系统检索式中,逻辑运算符OR、AND、NOT分别用符号+、*、^代替,请在构造检索式时注意。

逻辑“或”(OR) :

逻辑“OR"称为集合的并运算。两个集合之间进行逻辑“或”的结果是两个集合的并集,即两个集合的公共部分和任何一个集合的非公共部分。若用逻辑“或”(OR)运算符“+”将两个检索要求连起来,则一记录只要满足这两个检索要求之一,便符合新的检索要求。

逻辑“与”(AND) :

逻辑"与"称为集合的交运算。两个集合逻辑"与"的结果是仅含有两个集合公共成员的集合。若用逻辑“与”(AND)运算符“*”将两个检索要求连起来,则同时满足这两个检索要求的记录才符合新的检索要求。

逻辑“非”(NOT) :

逻辑“非”是集合的互斥运算,两个文献集合之间进行逻辑非的结果是获得不属于第二个集合但属于第一个集合的成员(Member)的集合。若用逻辑“非”(NOT)运算符“^”将两个检索要求连起来,则只有满足第1个条件但不满足第2个条件的记录才符合新的检索要求。

④ 字段级相邻检索与位置运算

字段级相邻检索运算 :

这些运算符比逻辑"与"算符有更大的限制,是自然语言检索或全文检索(FullText Search )必不可少的算符。

字段级运算符有:

(G):限定两个检索词在同一字段内(即使是可重复字段也当作一个字段来处理)。

比如:情报 (G) 检索系统, 这就要求命中集合中的记录某一字段内即含有检索词“情报”又含有检索词 "检索系统”。

位置运算 :

“ . ”:限定两个单汉字相邻。

“. .”:限定两个单汉字之间包含最多一个汉字。

“. . .”:限定两个单汉字之间包含最多两个汉字。

依此类推,位置运算操作符“.”的个数决定了两个单汉字之间最多可以包含的汉字总数,规则是可以包含的汉字总数为位置运算操作符“.”的个数减1。

需要特别注意的是:每个位置运算操作符“.”之间必须用空格隔开,并且位置运算操作符“.”与检索词之间也必须用空格隔开。

例如:检索表达式“万 . 方”可以命中检索包含“万方”的数据记录;检索表达式“万 . . 数”可以命中检索包含“万数”、“万方数”等的数据记录;检索表达式“万 . . . 据”可以命中检索包含“万据”、“万方数”、“万方数据”等的数据记录。

⑤ 布尔表达式的句法:

使用上面所介绍的运算符,将两个或两个以上检索词组合在一起,可以组成复杂的布尔表达式。与一般的代数一样,可以用括号来改变运算的顺序。

下面所介绍的算符的优先级自高而低如下所示:

高 $和.

| (G)

| *和^【万方数据库中高级检索中的精确与模糊有什么区别】

低 +

如果在同一表达式的同一级括号中,有两个或两个以上的优先级相同的算符出现,则按从左到右的顺序计算。

在组合检索式时,应遵守如下规则:

(1)除了相邻运算符“$”和“.”能重复出现外(这两个算符不能混合出现),两个逻辑算符不能彼此相邻。

(2) 括号必须成对出现。即开括号的数目必须等于闭括号的数目,且每个开括号都有相匹配的闭括号。

⑥ 操作限定符:

可以使用操作限定符来规定一个或多个检索词出现在某一字段或某一组字段内,这对于不同字段含有相同检索词的数据库尤其有用。限定符的一般格式为:

检索词/(t1,t2,t3,...)

其中t1,t2,t3...是一组字段标识符,它限定检索词出现在这些字段中。操作限定符与逻辑算符连用,以限制检索在规定的字段内进行。此外还可以将操作限定符用于右截断检索词中。 例如:“中国学位论文全文数据库”中可供检索的字段有:论文题名( 200)、作者( 300)、作者专业( 720)、导师姓名(380)、授予学位(700)、授予单位(303)、授予时间(440)、分类号(610)、关键词(620)、文摘(600),对于此库可进行如下检索:

1、博士/(700)*纳米*(2002/(440)+2003/(440)+2004/(440)) 检索此库所收录2002-2004年发表的有关“纳米”技术方面的博士论文

2、水利/(200,620,600) 检索此库中论文题名、关键词或文摘中含有“水利”一词的所有论文。

3、TV/(610)+水利/(200,620,600) 此库满足下列条件之一的论文满足此检索式:(1)、有一“分类号”以“TV”(水利工作)开头;(2)、论文题名、关键词或文摘中含有“水利”一词。

4、化学/(200)^(自动化学/(200)+机械化学/(200)+标准化学/(200)) 检此库“题名”中含有“化学”一词,但不含有自动化学、机械化学、标准化学这几个词的记录。

三、如何输入含有半角空格或".-"等字符的检索词(如西文词组)

在所输入的检索词中有半角空格或“.-”等字符时(如检索词是由多个西文单词组成的词组时),且要进行“模糊匹配”检索,则请用半角方框号([])将其括起来,便可表达出此检索要求。此方式是表达“相邻检索”的简单方法。

须提请注意的是:大部分数据库中的“分类号”、“馆藏号”等字段支持精确检索,直接输入要检索的分类号、馆藏号即可,它们在索引策略上不支持加半角方框号这一方式。但一般数据库中的题名、作者、母体文献、关键词、文摘等字段均支持加半角方框号这一方式。

例如:“期刊论文库”中可供检索的字段有:论文题名(200)、作者(300)、作者单位(330)、刊名(400)、出版年份(440)、刊期(442)、关键词(620)、文摘(600),且均支持模糊检索。对此

库可进行如下检索:

1、On*line 对一记录,只要On、line这2个词均在此其检索字段中出现过,此记录便符合此检索条件。

2、[On-line] 对一记录,只要其任一可检索字段中含有“on-line”这一词,此记录便符合此检索条件。“[On-line]”比“On*line”要求更严格,前者要求On、line顺序相邻。

3、On*line*Monitoring 对一记录,只要On、line、Monitoring这三个词均在此其检索字段中出现过,此记录便符合此检索条件。

4、[On-line Monitoring] 对一记录,只要其任一可检索字段中含有“On-line Monitoring”这一词组,此记录便符合此检索条件。[On-line Monitoring]”比“On*line*Monitoring”要求更严格,前者要求On、line、Monitoring顺序相邻。

5、On/(200)*line/(200)*Monitoring/(200) 对一记录,只要其“论文题名”中含有On、line、Monitoring这三个词,此记录便符合此检索条件。

6、[On-line Monitoring]/(200) 对一记录,只要其“论文题名”中含有“On-line Monitoring”这一词组,此记录才符合此检索条件。

7、On . line . Monitoring 对一记录,只要其任一支持模糊检索的字段中有这三个词“On line Monitoring”顺序相邻出现,此记录才符合此检索条件。

8、On/(200) . line/(200) . Monitoring/(200) 对一记录,只要其“论文题名”中有这三个词“On line Monitoring”顺序相邻出现,此记录才符合此检索条件。

9、On . . . line^On . line 对一记录,只要其任一支持模糊检索的字段中有“On line”这二个词顺序出现,且两词之间间隔一个或二个西文词(或中文汉字),此记录才符合此检索条件。这个检索式与“(On . . . line)^(On . line)”说明同样的检索要求。

万方数据库中高级检索中的精确与模糊有什么区别(二)
万方数据库的介绍与检索

方数据库的介绍与检索

作者:。。。

摘要: 本文详细介绍了万方数据库的特点和内容,同时还介绍了在计算机上检索万方数据库中的文献的方法和技巧,另外还给出了一些计算机检索的技巧和建议。

关键词: 万方数据库;检索方法;技巧;建议

引言

20世纪80年代以来,电子期刊数据库在我国发展迅速。经过近30年的建设,基本形成了CNKI、万方、维普三大综合型数据库(也称“三大数据库”)三足鼎立,其他各类小型数据库百花齐放的格局。随着社会的发展,数据库的价值逐渐被社会认识并形成独立的数据库产业,与此同时,对数据库的检索效率也有更高要求,其中万方数据库深受广大师生青睐。本文通过分析万方数据库检索平台的特点,对其进行总结并提出相应的参考建议,使用户更好地了解这个数据库的检索平台,从而在能提高用户的使用效率的同时,使数据库的资源能更好地发挥作用,更好地满足用户的需求,服务用户。

一、万方数据库的介绍

 简介

万方数据库是由中国科技信息所暨万方数据公司所属万方数据库中心专业组开发的一综合性数据库。1988年以来,该中心已相继推出了四大类13个系列的科技和工商类数据库,总记录达600万条以上。涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库;也是和中国知网齐名的中国专业的学术数据库。其开发公司——万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。

万方期刊:集纳了理、工、农、医、人文五大类70多个类目共7600种科技类期刊全文。 万方会议论文:《中国学术会议论文全文数据库》是国内唯一的学术会议文献全文数据库,主要收录1998年以来国家级学会、协会、研究会组织召开的全国性学术会议论文,数据范[1]

围覆盖自然科学、工程技术、农林、医学等领域,是了解国内学术动态必不可少的帮手。《中国企业、公司及产品数据库》的信息全年100%更新,提供多种形式的载体和版本。  版本

《中国学术会议论文全文数据库》分为两个版本:中文版、英文版。“英文版”主要收录在中国召开的国际会议的论文,论文内容多为西文。

 内容

万方科技信息数据库包含内容:

成果专利:内容为国内的科技成果、专利技术以及国家级科技计划项目。

中外标准:内容为国家技术监督局、建设部情报所提供的中国国家标准、建设标准、建 材标准、行业标准、国际标准、国际电工标准、欧洲标准以及美、英、德、法国国家标准和日本工业标准等。【万方数据库中高级检索中的精确与模糊有什么区别】

科技文献:包括会议文献、专业文献、综合文献和英文文献,涵盖面广,具有较高的权威性。

机构:包括我国著名科研机构、高等院校、信息机构的信息。

台湾系列:内容为台湾地区的科技、经济、法规等相关信息。

万方学位论文:万方学位论文库(中国学位论文全文数据库),是万方数据股份有限公司受 中国科技信息研究所(简称中信)委托加工的“中国学位论文文摘数据库”,该数据库收录我国各学科领域的学位论文。 我馆已经签约购买300万篇学位论文全文,目前已经完成近210万篇本地镜像全文数据的安装。

万方商务信息数据库:《中国企业、公司及产品数据库》始建于1988年,由万方数据联合国内近百家信息机构共同开发。十几年来,CECDB历经不断的更新和扩充,现已收录96个行业的近20万家企业详尽信息,是国内外工商界了解中国市场的一条捷径。目前,CECDB的用户已经遍及北美、西欧、东南亚等50多个国家与地区,主要客户类型包括:公司企业、信息机构、驻华商社、大学图书馆等。国际著名的美国DIALOG联机系统更将CECDB定为中国首选的经济信息数据库,而收进其系统向全球数百万用户提供联机检索服务。

 特色

(1)多元化发展,产品具有类型优势。万方的产品类型优势很明显,中外专利、中外标准、科技成果、新方志、法律法规、机构、科技名人等都是其重要的延伸产品,种类繁多。这种将信息资源进行分类,单独成库的做法符合未来数据库专业化发展方向,方便查阅和分

类订购,节省用户搜索时间和购买费用。目前,万方的数据库类型还在进一步扩充,相信未来将会有更丰富、更系统的资源提供给用户。

(2)自有特色数据库。万方自建的方志、科技视频、中国医学会期刊等数据库特色非常明显,这是其他数据库公司基本没有涉猎的,因此有一定的竞争力。

(3)服务企业的商务信息数据库。与其他数据库比起来,万方一个很明显的特色就是有众多的服务企业的数据产品,如商务信息数据库,包括《中国企业、公司和产品数据库》、《国家新产品数据库》、《百万商务通讯》、《中国高新技术企业》、《建材企业库》、《香港公司企业库》、《东南亚公司企业库》、《南韩公司企业库》、《综合经贸信息库》等。这也是万方最早提供的产品服务

本文来源:http://www.zhuodaoren.com/fanwen288864/

推荐访问:万方数据库论文检索 万方数据库检索方法
扩展阅读文章
热门阅读文章