图像搜索引擎(Image Search Engine)
目录 |
图像搜索引擎是一种专门用来查询图形、图像(照片)并以缩略图、网站名或网站内容等形式反馈检索结果的网卜检索工具。同文字搜索引攀类似一般可提供分类目录式或基于关键词的检索功能,基于内容的图像搜索技术正在不断研究应用之中。
图像搜索引擎的工作原理主要是利用其内部SPIDE(蜘蛛)程序自动对网站进行搜索并对在Web浏览过的图像进行分析和判别,为图像加注释、存储抽取出的索引信息,建立图像索引库,从索引库中或者直接从大量存储图像的数据库中杏找检索出具有相似特征的图像来。[1]
互联网上的图像检索技术经历两个阶段:基于文本方式的图像检索、基于图像内容的图像检索。
1.基于文本方式的图像检索
图像信息本身的特点使其在检索上有别于文本信息。参照传统文献标引的方法,通过对图像进行人工分折,对其物理特征和内容特征进行著录或标引、建立类似于文本文献的标引著录数据库,并通过检索这些数据库以获得图像编号索取实际图像。检索系统标引的图像特征包括责任者、出版日期、描述图像所含的关键词、主题词、解说文字或图像物理特征(拍摄方式、长度、载体规格等)。
基于文本方式的图像检索的四种途径:
1)利用文件扩展名和超文本标识符。图像文件通常以gif,.Jpg等作为扩展名,影像文件以.Mpg,.mpeg,.moov,.vhs,.avi等作为扩展名,在支持URI字段检索的检索工具中可输入相应的扩展名检得图像信息。超文本文件的图像标识符(IMGSRC)也可作为检索图像的信息。
2)利用图像标题和文字说明。图像带有的标题和文字说明信息作为揭示图像的重要内容是检索图像的关键信息源。
3)利用网页标题。每个万维网页都有一个标题,如标题能准确反映网页内容,而网页的内容又是图像信息,可以通过网页标题进行查询(如北京故宫三维If体环视照片)。
4)人工标引。通过人工对图像信息进行关键词标引检索效果最好,但由于数据量大、费用高,难以采用,目前在网上只能检索到极少量经过少、工标引的图像信息。
2.基于图像内容特征的图像检索
基于内容的图像检索主要依据图像的画面内容特征和主题对象特征(即图像的实际内容)来标引和检索。检索时可依据用户输入图像的某一特征(如绘制的草图、轮廓图或调用的相似图像)输出最佳匹配结果。检索系统组织图像数据时,根据图像内容的类别进行内容特征分析,建立基于内容特征的标引信息(例如图像色彩矢量)索引库,在索引库中将索引信息与实际图像数据联系起来。当用户进行检索时,用户在系统辅助下通过规定色彩比例、选择描绘对象形状、选择描绘纹理结构、选择范例图等形式构成自己的图像内容检索系统以同样的方法将用户输入的图像内容进行特征分析,建立检索特征索引,通过对图像内容特征的提问信息与被检信息之间的相似性计算,将与检索特征相似的图像检索出来。
可用于网络检索的图像信息内容特征包括:
1)静态图像内容特征。这类特征包括颜色、形状、纹理、结构等。利用颜色,用户可通过规定不同色彩之间的比例,主体与背景颜色等来查检颜色不同的图像。用户还可把事先规定并在屏幕上显示的形状(如一朵花、一匹马)作为检索依据,也可自己描绘所要检索图形的形状。根据纹理和结构等内容特征的图像检索方法与颜色检索类似。
2)动态图像内容特征。动态图像实质上是静态图像、影像和声音信息的混合体,声音信息的内容持征包括音频、响度、频宽、音色和节奏等,而影像信息内容特征则包括图内对象的运动特征(如一辆红色的马车从左到右驶过)、视场运动特征(镜头的变换)等。
1.通用类搜索引擎
①Google:其网址http://images.gogle.corn/o这是较全面、较好用的图像搜索工具。目前,它拥有经过标引的图像3.3亿幅。其工作过程是:Google分析web网页中与图像相近的文本内容,图像标题和用来确定图像内容的其他多种因素,并使用复杂的算法消除重复的图像以确保高质量的图像首先出现在搜索结果中。Google的搜索结果具有一个直观的缩略图,可挑选感兴趣的并点击之。②Ditto:其网址是http://www.ditto.com/:这是一个纯粹的图像搜索引擎。它的图像库与日俱增。利用Ditto检索图像很简单,首先在检索框中输入检索词,然后选择浏览偏好决定如何显示检索结果,最后递交。浏览偏好有简结式和详细式之分。
2.目录搜索引擎
①雅虎图像馆(yaho picture Gallarr)目前有40余万幅图像,这些图像按动物、艺术、文化娱乐、自然、科技、体育和旅游等进行分类组织,供人们浏览、挑选。另外,用户可以在检索框输入关键词进行图像检索。结果也是从缩略图显示。⑦Corbis:其网址是http:,,www.Corbis.com/corbis可搜索100多万内容,复盖各种主题的图像和艺术作品。它提供多种目录帮助用户检索所需的图像信息。用户可点击略图获得较大图像及其名称,和版权信息。
3.元搜索引擎
(1)1stopstock:其网址是www.1stopstock.corn/该引擎提供了八家图像供应商供用户访问。用户检索时有三种模式:①一选一;②所有免费作用;③所有版权保护。采用第一种模式,每次只搜索一个供应商的图像数据库。采用第二、三种模式可同时进行“多库”搜索,每个被搜索的库分别开一个窗口显示搜索结果。具体过程是,首先在文本检索框中输入检索词,然后选定搜索模式。最后递交。(2)ixquick:其网址ixquick.coral它是同时并行搜索许多杰出的搜索引擎,如:Ahavista、Fastsearch和yahoo等。这类引擎支持自然语言检索,支持通配符和高级布尔检索。其结果有些带有文件名、尺寸大小、维素等。
图像技术的成熟和人们对图像信息需求的增强,使互联网上的图像引擎站点越来越多,如国内的中文数码图像搜索,用户可直接键入简体中文或通过目录便可浏览到2500个分类子目录和120万幅中文图片索引。