大数据分析的案例、方法与挑战中山大学海量数据与云计算研究中心黄志洪2012
4DTCC2012数据分析者面临的问题数据日趋庞大,无论是入库和查询,都出现性能瓶颈用户的应用和分析结果呈整合趋势,对实时性和响应时间要求越来越高使用的模型越来越复杂,计算量指数级上升传统技能无法应对大数据:R、SAS、SQL中山大学海量数据与云计算研究中心黄志洪2012
4DTCC20122场景介绍信令监测是做什么的
中山大学海量数据与云计算研究中心黄志洪2012
4DTCC2012体系架构数据库服务器:HP小型机,128G内存,48颗CPU,2节点RAC,其中一个节点用于入库,另外一个节点用于查询存储:HP虚拟化存储,>1000个盘入库节点入库方式——常规路径sqlldr大量使用表分区设计数据量:每小时写入200G左右数据磁盘物理写大约为450G每小时问题:1入库瓶颈2查询瓶颈中山大学海量数据与云计算研究中心黄志洪2012
4DTCC2012数据库设计物理上采用ASM大表全部按时间分区,开始时按小时分区,但由于数据量庞大,后来改成15分钟分区,最后变成每分钟切换1个分区采用sqlldr方式入库中山大学海量数据与云计算研究中心黄志洪2012
4DTCC20125入库故障描述由于数据量太大,不得不同时启用多个处理机,产生了多个入库节点当入库节点分别增加到2节点和4节点以后,sqlldr出现停顿现象中山大学海量数据与云计算研究中心黄志洪2012
4DTCC2012AWR报告中山大学海量数据与云计算研究中心黄志洪2012
4DTCC2012AWR报告中山大学海量数据与云计算研究中心黄志洪2012
4DTCC2012AWR报告中山大学海量数据与云计算研究中心黄志洪2012
4DTCC2012关于BufferCache中山大学海量数据与云计算研究中心黄志洪2012