WEB 中图像的检索技术讨论第一章 前言1.1 引言伴随网络技术的迅猛进展,图片的来源不断在扩大,容量超大的高速存储系统给图片的海量存储给予了基本保障,各行业对图像的趋于增多,图像资源管理和搜索也愈发重要。但由于网络本身架构、管理的种种问题,想在网络精准、高效地找到所需的图像,却变成了件非常不易之事。由于网络现在的问题:内容没有良好的架构;网络海量信息不断的增多。由此,便出现了搜索引擎。虽然搜索引擎的出现给用户提供了不少的便捷,但是离精准、快速、全面的检索到自己所想要的图像还是有一段距离,所以对图像搜索的讨论还要下大力气讨论。依照现有的搜索引擎和国内外有关讨论人员的种种资料表明,现在的网络资源和搜索引擎的特点如下:(1)搜索的数据种类多样,如视频、图片、文字等。存取协议也是种类繁多,如HTTP、FTP、News 等等;(2)索引数据量巨大,从而导致不可能有某一个数据库可以包括整个网络的索引,当下最大的搜索引擎,其索引也仅仅覆盖了网络的一小部分而已;(3)资源消耗过大,系统需将 HTML 文档传送到本地之后再进行分析,占用昂贵的网络和 CPU 资源,从而增加被搜索结点的压力。此外由于搜索引擎大多是集中式的,所以搜索引擎服务器对硬件配置的要求也极高,这样才能处理巨大的数据量以及及时响应用户的检索请求;(4)不能有效解决搜索失效的问题,大多时候,搜索引擎会返回无用的查询结果;(5)各种检索工具各行其事,无法相互协作,共享资源,也是一种资源的浪费。1.2 现今的图像检索技术近些年伴随着用户对图像搜索需求不断的增长,各类图像搜索引擎由此诞生,它们以不同的搜索方式为用户提供各类检索途径,使得网上图像地检索变得简单,虽然还不太完善,但已经可以满足大多数用户的要求。1.2.1 搜索引擎的工作原理最初的搜索引擎结构,是让 Spider 不停的从 Web 收集数据,存储在搜索引擎数据库当中。用户靠搜索引擎服务器的 Web 接口,发出搜索请求,让 Web Server 通过 CGI或者其它技术访问数据库,并且将用户搜索请求变成相对应的数据存取语句,发送给引擎处理,然后把结果通过网页显示反馈给用户。网络检索的基本原理其实就是通过 Spider 定期在 web 上运行,发现新的数据,把其取回到本地数据库中,让用户查询的请求可通过查询本地的数据库得到。常用的网络信息检索实现机制可分为两种,通过手工方式对网页进行索引是一种方法,但它的缺陷是 Web 覆盖率低,且不能保证是最...