大数据与建模1、SQL用于访问和处理数据库的标准的计算机语言
用来访问和操作数据库系统
SQL语句用于取回和更新数据库中的数据
SQL可与数据库程序系统工作
比如MSAccess,DB2,Infermix,MSSQLServer,Oracle,Sybase以及其他数据库系统
SQL可以面向数据库执行查询,从数据库取回数据,在数据库中插入新的记录,更新数据库中的数据,从数据库删除记录,创建新数据库,在数据库中创建新表,在数据库中创建存储过程,在数据库中创建视图和设置表、存储过程和视图的权限等
2、Hadoop是一个能够对大量数据进行分布式处理的软件框架
但是Hadoop是以一种可靠、高效、可伸缩的方式进行处理的
Hadoop是可好的,因为他假设计算单元和存户会失败,因此他维护多个工作数据副本,确保能够针对失败的节点重新分布处理
Hadoop是高效的,因为他以并行的方式工作,通过并行处理加快处理速度
Hadoop还是可伸缩的,能够处理PB级数据
此外,Hadoop依赖于社区服务器,因此他的成本较低,任何人都可以使用
3、HPCC(highperformancecomputinggandcommunications)高性能计算与通信的缩写
1993年,由美国科学、工程技术联邦协调理事会向国会提交了“重大挑战项目”高性能计算与通信的报告,也就是被称为HPCC计划的报告,及美国总统科学战略项目,其目的是通过加强研究与开发解决一批重要的科学与技术挑战问题
HPCC是美国实施信息高速公路而上实施的计划,该计划的实施将耗资百亿美元,其主要目标要达到:开发可扩展的计算系统及相关软件,以支持太位级网络传输性能,开发千兆比特网络技术,扩展研究和教育机构及网络连接能力
4、Strom是自由的开源软件,一个分布式的、容错的实时计算系统
Strom可以非常可靠的处理庞大的数据流,用于处理Hadoop的