主题检索语言的特点特征

主题语言是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标志的一类检索语言。以主题语言来描述和表达信息内容的信息处理方法称为主题法。主题语言又可分为标题词、元词、叙词、关键词。

(1)标题词。标题词是指从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。标题词是主题语言系统中最早的一种类型,它通过主标题词和副标题词固定组配来构成检索标志,只能选用“定型”标题词进行标引和检索,所反映文献主题概念必然受到限制,不适应时代发展的需要,目前已较少使用。

(2)元词。元词又称单元词,是指能够用以描述信息所论及主题的最小、最基本的词汇单位。经过规范化的能表达信息主题的元词集合构成元词语言。元词法是通过若干单元词的组配来表达复杂的主题概念的方法。元词语言多用于机械检索,适于用简单的标志和检索手段(如穿孔卡片等)来标记信息。

(3)叙词。叙词是指以概念为基础、经过规范化和优选处理的、具有组配功能并能显示词间语义关系的动态性的词或词组。一般来讲,选做的叙词具有概念性、描述性、组配性。经过规范化处理后,还具有语义的关联性、动态性、直观性。叙词法综合了多种信息检索语言的原理和方法,具有多种优越性,适用于计算机和手工检索系统,是目前应用较广的一种语言。CA、EI等著名检索工具都采用了叙词法进行编排。

(4)关键词。关键词是指出现在文献标题、文摘、正文,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。关键词法主要用于计算机信息加工抽词编制索引,因而称这种索引为关键词索引。目前,关键词法得到了广泛的应用,出现了多种关键词索引,常见的有题内关键词索引、题外关键词索引、词对式关键词索引和纯关键词索引等。其优点为计算机自动编排各种关键词索引,加速文献的标引速度和缩短检索工具出版的滞后时间;其缺点为检索质量较差,可能会在标引和检索之间造成歧义或误差,从而导致漏检或误检。

版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。http://www.lnzdy.com/3090.html
返回顶部