大数据背景下道路运输运营管理数据挖掘讨论与应用近年来,随着移动互联网、物联网、计算机技术等新兴科技的盛行,行业应用产生的信息呈现爆炸式进展的态势,“大数据”一词突然成为各行各业炙手可热的新名词
道路运输行业也紧跟时代潮流,基于车联网和信息技术等新兴科技催化下的信息资源,具有规模性、高速性、复杂性、多样性等“大数据”特征
通过高效开发、利用道路运输信息资源的“加工”能力实现其“增值”作用,为行业管理提供决策支持,已是大势所趋
为此,本文依托道路运输中的核心信息系统进行数据挖掘,旨在能够助力行业运营管理
数据挖掘技术作为一门多领域、多学科的融合技术,在各行各业中应用广泛
本文在借鉴国内外学者关于数据挖掘理论、方法、行业应用等的讨论成果基础上,通过深化探讨实施大数据分析的基础条件,即历史信息、资源共享、决策目标,明确了本文的讨论主题
提出应用聚类分析、粗糙集、关联规则方法改善现有道路运输经营状况,并得到有效性验证
基于班线客运市场运营中现存的运输模式常年固定不变的问题,从客运线路、发车日期、发车时间三个角度进行数据挖掘
通过合理的数据预处理和分析指标的选择,采纳 Two Step 聚类分析方法,即构建 CF 树将数据集预聚类为较小子集,再应用凝聚的层次聚类合并为最佳数量的类别
应用 SPSS Modeler 软件建立数据流模型并实现结果的可视化展示
最终得出旅客频繁出行的线路、时间的规律,为客运管理者开展以旅客为中心,按需定制、灵活发班的客运经营模式提供决策依据
基于卫星定位信息系统中的运输业户考核信息数据,结合粗糙集理论与关联规则方法,对数据进行预处理约简来提高生成规则的质量
从数据离散化、属性约简、规则构建三个方面设计算法,应用信息熵理论、遗传算法和 Apriori 方法实施数据挖掘
通过条件属性的约简明确影响考核结果的关键因素,并缩减规则构建的输入信息,以简洁明了、科学有效