简介:摘要: 现如今,人们的生活质量在不断提高,对于电力的需求在不断加大, 针对电力大数据流的异常检测问题,该文将流数据聚类算法与电力大数据相结合,针对现有流数据聚类算法不易存储全部数据、断电数据易丢失等问题,以及流数据聚类算法对于离线阶段聚类算法实时应答的要求,从数据的完整性、安全性以及流数据聚类算法的低时间复杂度的角度出发,对 CluStream 流数据聚类算法进行改进,提出流式 K-means 聚类算法。对在线阶段,使用 Redis 集群进行流数据的缓冲,并设计节点时间衰减策略,增大心跳消息中有效消息所占比例;对离线阶段聚类算法进行优化,使用最佳距离法确定初始聚类中心,减少迭代次数;最后,使用所提出的流式 K-means 聚类算法进行用户用电异常行为检测,实验结果表明,该算法能够很好的发现用户用电异常行为。
简介:摘要:如何在海量用户数据中定位可疑窃电用户是防窃电的关键技术。文章分析现有防窃电技术,建立防窃电评价体系,利用大数据处理方法,对海量用户数据进行特征量提取;针对提取后数据采用数据挖掘技术,构建防窃电模型,定位可疑用户。工程实例表明,文章所示算法,能有效剔除冗杂数据,提高算法精度,具有较好的可靠性和有效性。
简介:为了实现电梯安全事故的预警预报,研究了电梯安全大数据的挖掘方法.以电梯安全远程监管系统数据库中的电梯状态数据、基础数据、日常维保数据、故障数据以及违章数据作为数据源构建电梯安全大数据平台,包括数据采集模块、预处理模块、数据挖掘模块和数据展示模块.着重研究了改进的K-Means聚类算法和Apriori关联算法.实验表明:两种改进算法的加速比与可扩展性更好.利用聚类算法分析了各小区、不同品牌电梯的电梯故障情况以及各维保公司的故障修复率,利用关联算法分析了各小区及不同品牌电梯的特定频发故障,对电梯安全管理具有指导意义.
简介:摘要:随着计算机网络技术的发展,互联网在许多领域的应用越来越广泛,但在互联网促进各个领域发展的同时,大数据网络的信息安全也出现了许多问题,给个人或企业带来了巨大的损失。针对上述网络信息安全问题,一些出版物也进行了相关研究。该方法基于AES(Advancedencryptionstandard)算法进行网络信息安全分析,密钥生成时间非常短,灵敏度较好,AES计算容易抵御强烈和暂时的攻击,但该方法内存较小,只能在内存有限的环境中使用。网络的信息安全是基于MD5(messagedigestal-algorithm5)加密算法,这种方法具有良好的压缩性,易于计算,抗变化性和抗冲突性强,但这种方法的最终结果很容易被原始文本破解。
简介:摘 要:本文对遗传算法在数据挖掘中的应用进行了广泛的研究,阐明了数据挖掘的定义和常用技术,对遗传算法在数据挖掘领域中实现的原理和目前应用进行了详细阐述,并讨论了遗传算法在数据挖掘中所面临的问题。
简介:针对大数据处理框架MapReduce中的任务调度问题,提出一种基于Markov决策过程(MarkovDecisionProcess,MDP)的任务调度算法,通过状态集来描述集群中节点的负载和作业的数据本地性需求,使用状态转移函数表示调度策略对状态的影响,采用值迭代求解算法求取最优策略,实现集群中节点的最优调度.实验结果表明,该算法能够保证数据本地性的同时,减少作业响应时间,提高系统综合性能.