目录 |
信息检索语言是信息组织与信息检索时所用的语言,也称文献检索语言、情报语言等。信息资源在存储过程中,其内容特征(分类、主题)和外部特征(如书名、刊名、题名、著者等)按照一定的语言来加以表达,检索文献信息的提问也按照一定的语言来表达,为了使检索过程快速、准确,检索用户与检索系统需要统一的标识系统,这种在文献信息的存储与检索过程中,共同使用、共同理解的统一标识就是检索语言。信息检索语言主要有两大类:分类检索语言和主题检索语言。
信息检索语言是为查找信息服务的,因此,它必须具备以下的功能。
1.信息检索语言应可表示文献内容、数据或其他信息形式。为了满足不同信息用户的需要,信息检索语言应能根据不同的信息需求,表达不同的类型。例如,检索某种器材的性能时,信息检索语言应能表达某些数据指标;而在检索某种物质结构时,又能表达物质名称和物质结构方式。
2.有专用概念表示用户的信息提问。信息检索不单纯是字面上的组合,而是一种概念上的匹配。例如,计算机绘图,这里有两个名词,既可拆又可合。拆开后,依据“计算机”可查出“计算机解题”、“计算机控制”、“计算机维修”、“计算机绘图”等信息;但“绘图”却涉及到美术绘图、工程绘图、计算机绘图等,检索不集中。在信息检索语言中,概念组配“计算机绘图”只表示一种概念,这样专指性强,命中率高。
3.能指示计算机执行查询与检索。检索者用语言项概念表达了信息提问后,要根据检索系统的功能编写成检索策略,使检索系统能顺利、快速地查到信息提问所需要的信息。
区分依据 | 类型 | 概念 | |
---|---|---|---|
按结构原理 | 分类语言 | 等级制体 系分类法 | 用分类号表达各种概念并将其按学科性质进行分类和系统排列 |
组配分类法 | |||
按专业范围 | 综合性检索语言 | 在一定范围内或国际范围内通用的检索语言,如各国图书分类法、国际十进制分类法等 | |
专业性检索语言 | 适用于某一专业领域的检索语言,如各国专利分类法、标准分类法等 | ||
按标识的组 合使用方法 | 先组式检索语言 | 文献等级制标识在编表时就已固定组配,检索时不可以改变的语言,如体系分类法、主题法 | |
后组式检索语言 | 文献标识在检索时可以根据需要自由组配的语言,如组配分类法、单元词或叙词索引等 | ||
按描述语言 的选词特征 | 单元词 | 代表文献实质意义、可以独立存在的最小概念单元 | |
叙词 | 经规范化的可以独立表达主题概念的词语 | ||
关键词 | 直接使用的基本上不加规范的自然词语 | ||
主题词 | 代表文献实质意义经规范化的词语 | ||
代码 | 表示事物某一方面特征的符号标识,如化合物分子式、环状化合物标识等 | ||
引证 | 一种表示科学论文之间相互引用关系的语言 | ||
按描述文献 的特征 | 外表特征标识 | 文献上显而易见的特征标识,如作者姓名、文献篇名、文献代号、机构名、刊物来源等 | |
内容特征标识 | 表示文献主题实质意义的特征标识,如分类语言、主题词、单元词、叙词、关键词、自然语言等 |
检索语言可以是一系列概括文献信息内容的概念及其相互关系的标识系统(分类号码);也可以是自然语言中选择出来并加以规范化的一套词汇(主题词表或叙词表)。它的功能主要是:简单明了而又比较专指地描述文献的主题概念;容易将概念进行系统排列;检索时便于将标引用语和检索用语进行相符性比较等。为此,检索语言必须排除一词多义、多词一义和词义含糊的现象,并且还能显示出概念间的各种相互关系,这也是检索语言规范化的主要内容。
信息检索语言的职能主要包括以下三个方面。
为了满足不同信息用户的需要,信息检索语言能够根据不同的信息需求,表达不同的类型。
信息检索不单纯是字面上的组合,而是一种概念上的匹配。
策略,使检索系统能顺利、快速地查到信息提问所需要的信息。