目录 |
从宏观上说,知识组织系统的互操作是当前知识组织工具发展的重要特征,即从单一知识组织系统的独立建设向各类知识组织系统的整合方向发展、从各学科的局部建设向跨领域的集成方向发展、从单一语种的构建向多语种对照和映射的方向发展。即便是传统知识组织系统,也存在由于版本升级、不同语种对照和不同类型整合(如分类主题一体化等)等问题需要相应的知识组织系统管理软件支持和解决。因此,互操作的支持能力成为评价知识组织系统管理软件的一项重要指标。
如前所述,互操作是指两个或多个系统相互使用已被交换的数据/信息的能力,而知识组织系统的互操作就是指不同知识组织系统之间的兼容互换。当前,各种数字图书馆、主题网关(学科信息门户)以及搜索引擎等成为业界研究的热点和建设的重点,而如何通过异质知识组织系统间的互操作,为用户提供跨库、跨系统、跨语言的浏览与检索是图书馆界和信息界正在重点关注的一个热点课题。即多类型、多语言的知识组织系统之间的互操作,是实现分布式信息资源系统交叉浏览和集成检索的有效方法,也是目前知识组织系统建设的主要内容。
资源组织要实现知识组织系统间的互操作,就是要找到某种方法,使具有不同标识、结构、载体的分类表或主题词表或形式化本体等的成分建立联系,用户只用一种检索语言或直接使用自然语言就可实现联网环境下的跨数据库或信息系统检索。而要实现这一目标就必须在信息描述、检索、对象交换与检索协议等方面取得突破性进展。需要解决的问题另还包括元数据的定义和通过文本或多媒体数字对象等抽取元数据,数字对象的特征描述计算,具有不同语义的异构资源库的整合,信息的聚类和自动分类、自动排序、分级算法等。
国内外学术界一直比较重视知识组织系统问的互操作研究,实施了许多积极而有成效的研究计划,而且一些研究成果也已在实践中得到应用。据司莉所做的调查,国内外已开展的数十项知识组织系统的互操作研究计划大致可以归为以下三类:一类是相同结构间的互操作研究,包括标题法之间、叙词表之间以及分类法之间的互操作研究。其中,叙词表之间和分类法之间的互操作研究占这类互操作研究的八成以上。第二类是不同结构间的互操作研究,包括两种知识组织系统(比如叙词表与分类法、分类法与标题表)以及三种以上知识组织系统问的互操作研究。对多种知识组织系统间的互操作研究已成为今后研究的重点,也是互操作领域研究的发展趋势。第三类是涉及两种语言以上的互操作研究,约有十多项。这一方面是各国文化的发展、不同文化之间的交流和融合发展的结果,另一方面也说明知识组织系统的互操作研究国际化和全球化的程度在不断加深。语言障碍和异构系统是用户利用知识信息的最大阻碍,因此互操作也成为网络知识组织系统(NKOS)重点讨论的一项关键技术。其中,跨语言的互操作在美国和欧洲尤其受到重视,美国数字图书馆先导计划(DigitalLibrary Initiative)中有许多项目就是解决语义互操作问题的。例如Illinois大学主持的项目中关于概念空间与分类地图的研究,伯克利(Berkeley)大学主持的项目中对于消除文字歧义的研究,卡内基梅隆(CarnegieMellon)大学主持的项目中对于语音识别的研究以及加州大学圣塔巴巴拉分校关于图像的分割与聚类的研究,主要集中于人工智能、统计规律识别技术等,这些都属于语义研究或语义互操作研究范畴。欧洲的相关研究项目有Renardus、MACS、Merimee等,甚至尝试自动建立中、英文词表之间的映射。我国也有一些关于双语数字图书馆知识组织系统互操作的研究,例如《汉语主题词表》与LCSH、本体之间的转换研究、《中图法》与DDC类目设置的比较、与DDC对照系统的研制等。
异构系统间的互操作的目标是实现不同系统间的知识交换、共享和重用。这方面需要解决的问题除了跨语言、跨文化互操作(未来的数字图书馆系统将是联邦数字图书馆。即建立全球范围的数字图书馆系统,需要解决跨语言、跨文化的互操作问题,其中包括比较复杂的语言翻译问题)问题外,还有不同本体间的互操作(本体作为语义万维网建设的核心,为数字图书馆系统的语义互操作提供了解决方案,但其本身也存在着异构性,因此不同本体间的互操作也是数字图书馆系统互操作的一个方面),以及各类知识组织系统安全性问题。开展多语种知识组织系统互操作的研究,将有助于世界范围内信息资源的整合与共享,具有很大的现实意义。与国外互操作研究相比,我国这方面的研究一是起步较晚,二是研究的项目数量比较少,因此相应的实践成果也较少。目前已经开展的研究项目主要包括中医药一体化语言系统、AGROVOC词表的中文翻译、《中图法》与DDC映射系统、教育集成词库构建系统、医学分类主题一体化系统建设、汉语科技词系统等。而涉及分类法与主题法之间的互操作的技术方式较为单一,主要为对照索引式的分类主题一体化词表。
综合国内外知识组织系统的研究,我们将各种类型的知识组织系统粗略划分为两类,一类是传统知识组织系统,包括术语表、分类表、类目表、标题表、叙词表及其他情报检索语言与标引语言等;另一类是以形式化本体为代表的新型知识组织系统。与此相应同时也是为了论述的方便,本节将知识组织系统互操作也大致分为两类,一类是传统知识组织系统间的互操作,另一类本体间的互操作。