电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

深度解析分布式数据流系统

深度解析分布式数据流系统_第1页
1/16
深度解析分布式数据流系统_第2页
2/16
深度解析分布式数据流系统_第3页
3/16
深度解析分布式数据流系统 摘要:分析了基于结构化覆盖网的分布式查询处理模型,支持大量数据流的分布式存储,连续查询间、查询内的并行处理操作,能够在很大程度上消除资源约束问题,提高了查询性能、服务质量,并且该查询模型具有很好的扩展性。关键词:分布式数据流,分布式数据流系统 近年来,数据流查询处理是数据库讨论领域的一个热点方向。数据流的特征可概括为无限性、瞬时性、流速不定性、语义不定性等。针对数据流的以上特征,不考虑将数据流存储在传统的关系数据库中,数据流上的查询是近似查询、连续查询(continuousquery)。目前,数据流管理系统中所采纳的近似查询的方法主要有以下几种:随机抽样(randomsampling)、数据写生、直方图(histograms)、小波变换(wavelets)、窗口等。如何保证查询的服务质量成为上述各种近似查询方法必须考虑的问题。数据流上的查询处理给人们提出了一个很大的难题——对处理器、内存等系统资源非常苛刻的需求。到目前已经出现了许多数据流的原型系统:单节点上的数据流管理系统,如 Stanford 大学的Stream[1]系统、布朗大学的 Aurora[2,3]系统等;有分布式数据流处理系统,如 MIT的 Medusa[4,5]项目,Brandeis、Brown、MIT 的合作项目Borealis[6,7]等。这些项目在数据流处理的查询语言、近似查询算法、保证服务质量的策略,以及系统的负载均衡等方面做了大量的工作,但同时也揭示出在分布式数据流处理系统中更多值得讨论的问题。本文将对基于 structuredoverlaynetwork的分布式数据流系统的近似、自适应查询处理进行讨论,给出查询处理模型。 1 集中式数据流查询处理及分布式散列表、Chord 路由协议的相关说明 1.1 数据流查询处理相关的概念定义以及假设说明 集中式数据流查询处理的体系结构由两部分构成,即查询计划生成子系统以及查询执行子系统(BACK)。其中两部分与关系数据库系统相比均有较大的区别。查询执行子系统如图 1 所示。 通过这种散列,将系统当前的所有查询映射到节点空间,然后由该节点上的查询处理器完成到达的查询。 b)查询内并行处理方式。在系统的范围内,由操作符、输入均输出记录队列、维持操作符状态的大纲信息构成网状结构。 c)命名发现机制。参加查询处理的节点有全局惟一命名 participant。当在一个节点上面定义一个新的流模式、数据流、操作符,这些实体均隶属于其命名空间。该实体可以采纳下面的命名方式:。为了了解系统中数据流模式的定义、系统中的数...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

深度解析分布式数据流系统

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部