WEB 中图像的检索技术讨论第一章 前言1
1 引言伴随网络技术的迅猛进展,图片的来源不断在扩大,容量超大的高速存储系统给图片的海量存储给予了基本保障,各行业对图像的趋于增多,图像资源管理和搜索也愈发重要
但由于网络本身架构、管理的种种问题,想在网络精准、高效地找到所需的图像,却变成了件非常不易之事
由于网络现在的问题:内容没有良好的架构;网络海量信息不断的增多
由此,便出现了搜索引擎
虽然搜索引擎的出现给用户提供了不少的便捷,但是离精准、快速、全面的检索到自己所想要的图像还是有一段距离,所以对图像搜索的讨论还要下大力气讨论
依照现有的搜索引擎和国内外有关讨论人员的种种资料表明,现在的网络资源和搜索引擎的特点如下:(1)搜索的数据种类多样,如视频、图片、文字等
存取协议也是种类繁多,如HTTP、FTP、News 等等;(2)索引数据量巨大,从而导致不可能有某一个数据库可以包括整个网络的索引,当下最大的搜索引擎,其索引也仅仅覆盖了网络的一小部分而已;(3)资源消耗过大,系统需将 HTML 文档传送到本地之后再进行分析,占用昂贵的网络和 CPU 资源,从而增加被搜索结点的压力
此外由于搜索引擎大多是集中式的,所以搜索引擎服务器对硬件配置的要求也极高,这样才能处理巨大的数据量以及及时响应用户的检索请求;(4)不能有效解决搜索失效的问题,大多时候,搜索引擎会返回无用的查询结果;(5)各种检索工具各行其事,无法相互协作,共享资源,也是一种资源的浪费
2 现今的图像检索技术近些年伴随着用户对图像搜索需求不断的增长,各类图像搜索引擎由此诞生,它们以不同的搜索方式为用户提供各类检索途径,使得网上图像地检索变得简单,虽然还不太完善,但已经可以满足大多数用户的要求
1 搜索引擎的工作原理最初的搜索引擎结构,是让 Spider 不停的从 Web 收集数据,存储在搜索引擎数据库当中