BigData技术综述

下载本文档

阅读 162
下载 7
格式 pdf
大小 410.05 KB
约6页
2025-01-27 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/6页

2/6页

3/6页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

Big Data 技术综述 2011-08-10 16:45 baiyuzhong 程序员我要评论(0) 字号：T | T Big Data 是近来的一个技术热点，但从名字就能判断它并不是什么新词。毕竟，大是一个相对概念。历史上，数据库、数据仓库、数据集市等信息管理领域的技术，很大程度上也是为了解决大规模数据的问题。被誉为数据仓库之父的Bill Inmon 早在20 世纪90 年代就经常将Big Data 挂在嘴边了。 AD： Big Data 是近来的一个技术热点，但从名字就能判断它并不是什么新词。毕竟，大是一个相对概念。历史上，数据库、数据仓库、数据集市等信息管理领域的技术，很大程度上也是为了解决大规模数据的问题。被誉为数据仓库之父的Bill Inmon 早在20 世纪90 年代就经常将Big Data 挂在嘴边了。然而，Big Data 作为一个专有名词成为热点，主要应归功于近年来互联网、云计算、移动和物联网的迅猛发展。无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据，数以亿计用户的互联网服务时时刻刻在产生巨量的交互„„要处理的数据量实在是太大、增长太快了，而业务需求和竞争压力对数据处理的实时性、有效性又提出了更高要求，传统的常规技术手段根本无法应付。在这种情况下，技术人员纷纷研发和采用了一批新技术，主要包括分布式缓存、基于MPP 的分布式数据库、分布式文件系统、各种NoSQL 分布式存储方案等。 10 年前，Eric Brewer 提出著名的CAP 定理，指出：一个分布式系统不可能满足一致性、可用性和分区容忍性这三个需求，最多只能同时满足两个。系统的关注点不同，采用的策略也不一样。只有真正理解了系统的需求，才有可能利用好CAP 定理。架构师一般有两个方向来利用CAP 理论。  Key-Value 存储，如Amazon Dynamo 等，可以根据CAP 理论灵活选择不同倾向的数据库产品。  领域模型+分布式缓存+存储，可根据CAP 理论结合自己的项目定制灵活的分布式方案，但难度较高。对大型网站，可用性与分区容忍性优先级要高于数据一致性，一般会尽量朝着A、 P 的方向设计，然后通过其他手段保证对于一致性的商务需求。架构设计师不要将精力浪费在如何设计能满足三者的完美分布式系统，而应该懂得取舍。不同的数据对一致性的要求是不同的。SNS 网站可以容忍相对较长时间的不一致，而不影响交易和用户体验;而像支付宝这样的交易和账务数据则是非常敏感的，通常不能容忍超过秒级的不一致。图 1 memcached 构成Cache 篇...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

BigData技术综述

Big Data 技术综述 2011-08-10 16:45 baiyuzhong 程序员我要评论(0) 字号：T | T Big Data 是近来的一个技术热点，但从名字就能判断它并不是什么新词

毕竟，大是一个相对概念

历史上，数据库、数据仓库、数据集市等信息管理领域的技术，很大程度上也是为了解决大规模数据的问题

被誉为数据仓库之父的Bill Inmon 早在20 世纪90 年代就经常将Big Data 挂在嘴边了

AD： Big Data 是近来的一个技术热点，但从名字就能判断它并不是什么新词

毕竟，大是一个相对概念

历史上，数据库、数据仓库、数据集市等信息管理领域的技术，很大程度上也是为了解决大规模数据的问题

被誉为数据仓库之父的Bill Inmon 早在20 世纪90 年代就经常将Big Data 挂在嘴边了

然而，Big Data 作为一个专有名词成为热点，主要应归功于近年来互联网、云计算、移动和物联网的迅猛发展

无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据，数以亿计用户的互联网服务时时刻刻在产生巨量的交互„„要处理的数据量实在是太大、增长太快了，而业务需求和竞争压力对数据处理的实时性、有效性又提出了更高要求，传统的常规技术手段根本无法应付

在这种情况下，技术人员纷纷研发和采用了一批新技术，主要包括分布式缓存、基于MPP 的分布式数据库、分布式文件系统、各种NoSQL 分布式存储方案等

10 年前，Eric Brewer 提出著名的CAP 定理，指出：一个分布式系统不可能满足一致性、可用性和分区容忍性这三个需求，最多只能同时满足两个

系统的关注点不同，采用的策略也不一样

只有真正理解了系统的需求，才有可能利用好CAP 定理

架构师一般有两个方向来利用CAP 理论

 Key-Value 存储，如Amazon Dynamo 等，可以根据

小辰5 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

BigData技术综述

BigData技术综述

您可能关注的文档

相关文档

热门下载

相关标签