学科分类
/ 25
500 个结果
  • 简介:

  • 标签:
  • 简介:摘要:大数已经成为全球信息技术和信息产业的热点,它具有数据量大、多样性、价值密度低、处理速度快、分析能力强等特点,能够快速的处理和分析海量的数据。在大数时代,数据量呈爆发式增长,要想保证信息处理的高效率和准确性,必须要有完善的数据处理和分析技术,并且对算法进行合理的设计。在此背景下,本文将对大数算法数据分析技术进行探究,首先介绍大数的相关概念以及特征;其次对大数处理与分析技术进行简单的介绍。

  • 标签: 大数据算法 数据分析 应用探究
  • 简介:摘要随着互联网时代的到来,人们每天使用到的数据呈指数的数量增长,大量数据的出现使我们对大数的概念和行业有了新的了解,本文将通过对大数概念和行业的简要介绍进一步了解大数分析流程,我们将在文中介绍几种常用的大数算法大数理论内涵,希望通过这些内容能够对大数在社会生活中的应用进行合理的总结和分析。

  • 标签: 大数据 数据挖掘 算法
  • 简介:摘要:围绕大数安全与隐私保护算法展开研究,着眼于解决数据规模庞大、高速实时性要求、复杂多样的数据来源、隐私泄露风险、算法效率与性能、法规与标准不足等问题。通过深入分析现有隐私保护挑战,提出一系列创新性对策,并在实时性与性能平衡、法规与标准建设等方面进行探讨。在为大数领域提供更为健全的隐私保护机制,推动大数安全发展。

  • 标签: 大数据 隐私保护 算法创新 实时性
  • 简介:摘要本文分析了汽车行业基于不同思想的各类大数聚类算法,用户应该根据实际应用中的具体问题具体分析,选择恰当的聚类算法。聚类算法具有非常广泛的应用,改进聚类算法或者开发新的聚类算法是一件非常有意义工作,相信在不久的将来,聚类算法将随着新技术的出现和应用的需求而在汽车行业得到蓬勃的发展。

  • 标签: 汽车 大数据 聚类算法 划分
  • 简介:摘要: 现如今,人们的生活质量在不断提高,对于电力的需求在不断加大, 针对电力大数流的异常检测问题,该文将流数据聚类算法与电力大数相结合,针对现有流数据聚类算法不易存储全部数据、断电数据易丢失等问题,以及流数据聚类算法对于离线阶段聚类算法实时应答的要求,从数据的完整性、安全性以及流数据聚类算法的低时间复杂度的角度出发,对 CluStream 流数据聚类算法进行改进,提出流式 K-means 聚类算法。对在线阶段,使用 Redis 集群进行流数据的缓冲,并设计节点时间衰减策略,增大心跳消息中有效消息所占比例;对离线阶段聚类算法进行优化,使用最佳距离法确定初始聚类中心,减少迭代次数;最后,使用所提出的流式 K-means 聚类算法进行用户用电异常行为检测,实验结果表明,该算法能够很好的发现用户用电异常行为。

  • 标签: 电力大数据 流数据聚类 流式 K-means聚类 用户用电异常
  • 简介:摘要:数据科学和大数分析的方法与算法正不断发展和演进,以应对日益增长的数据需求和复杂性。数据科学旨在通过运用数学、统计学、计算机科学和领域知识来提取有价值的见解和知识,为了理解和利用海量的数据,需要掌握各种方法和算法

  • 标签: 数据科学 大数据分析方法 算法
  • 简介:摘要为提高反窃电工作效率,开展基于用电信息采集系统的大数用户疑似窃电算法研究,提出了基于电量波动的离群点算法及聚类算法疑似度模型、基于负荷数据的支持向量机算法疑似度模型和窃电行为分析模型等窃电模型,通过窃电疑似度计算输出,能更精准地发现窃电用户,从而提升窃电查处效率和管理水平。

  • 标签: 用电信息采集系统 大数据 疑似度模型 窃电行为
  • 简介:摘要:如何在海量用户数据中定位可疑窃电用户是防窃电的关键技术。文章分析现有防窃电技术,建立防窃电评价体系,利用大数处理方法,对海量用户数据进行特征量提取;针对提取后数据采用数据挖掘技术,构建防窃电模型,定位可疑用户。工程实例表明,文章所示算法,能有效剔除冗杂数据,提高算法精度,具有较好的可靠性和有效性。

  • 标签:
  • 简介:为了实现电梯安全事故的预警预报,研究了电梯安全大数的挖掘方法.以电梯安全远程监管系统数据库中的电梯状态数据、基础数据、日常维保数据、故障数据以及违章数据作为数据源构建电梯安全大数平台,包括数据采集模块、预处理模块、数据挖掘模块和数据展示模块.着重研究了改进的K-Means聚类算法和Apriori关联算法.实验表明:两种改进算法的加速比与可扩展性更好.利用聚类算法分析了各小区、不同品牌电梯的电梯故障情况以及各维保公司的故障修复率,利用关联算法分析了各小区及不同品牌电梯的特定频发故障,对电梯安全管理具有指导意义.

  • 标签: 电梯安全 数据挖掘 HADOOP平台 K-MEANS算法 APRIORI算法
  • 简介:摘要:本文综述了大数技术与应用中的数据挖掘算法与模型构建过程。首先介绍了大数技术的发展趋势,包括数据量不断增长、数据类型多样化、数据智能化应用以及边缘计算的兴起。然后探讨了数据挖掘算法的分类与常见算法,如分类算法、聚类算法和关联规则挖掘等。接着详细阐述了数据挖掘模型构建的流程,包括数据预处理、特征工程、模型选择与评估以及模型优化与调参等步骤。最后,强调了数据挖掘技术在各行业的广泛应用和未来发展趋势,为实现更精准的决策和创新提供了重要支持。

  • 标签: 大数据技术 数据挖掘 模型构建
  • 简介:摘要:随着铁路建设规模的不断扩大和运输需求的增加,铁路轨道的维护和保养显得尤为重要。而轨道状态监测数据作为重要的信息来源,可以帮助确定轨道状况,进行及时的维护和修复,提高铁路的安全性和运营效率。然而,由于轨道状态监测数据量庞大且复杂,传统的数据处理方法已经无法满足需求,因此需要研究大数处理和优化算法,从中提取有价值的信息,并帮助工务部门做出准确的决策和规划。

  • 标签: 工务轨道 动态检测数据 大数据处理 优化算法
  • 简介:摘要:随着计算机网络技术的发展,互联网在许多领域的应用越来越广泛,但在互联网促进各个领域发展的同时,大数网络的信息安全也出现了许多问题,给个人或企业带来了巨大的损失。针对上述网络信息安全问题,一些出版物也进行了相关研究。该方法基于AES(Advancedencryptionstandard)算法进行网络信息安全分析,密钥生成时间非常短,灵敏度较好,AES计算容易抵御强烈和暂时的攻击,但该方法内存较小,只能在内存有限的环境中使用。网络的信息安全是基于MD5(messagedigestal-algorithm5)加密算法,这种方法具有良好的压缩性,易于计算,抗变化性和抗冲突性强,但这种方法的最终结果很容易被原始文本破解。

  • 标签: 大数据算法 网络信息安全 系统设计
  • 简介:摘要:互联网技术和海量数据存储技术的发展,使得人们可以收集更多的数据数据挖掘技术的诞生为人们有效利用这些数据提供了新的方法。面对糕点类连锁门店品类繁多且不断变换的商品,商家应快速地分析和运用每天产生的大量销售数据,在顾客进店时或者购买过程中及时向其推荐可能感兴趣的商品或者信息,从而提高销售效率和销售量。此外,商家也可以将数据挖掘结果所提供的特征用于新产品的开发,生产出可能受顾客欢迎的产品。本文主要分析大数技术及遗传算法数据挖掘中的应用研究。

  • 标签: 遗传算法 关联规则 适应度函数 遗传算子
  • 简介:摘要:伴随大数技术的广泛运用,为提高高校图书馆图书储量与购买的科学性、实用性和节约性,探索一种科学有效的图书借阅业务大数分类方法,提升图书订购的针对性和有效性。本论文以某地方高校图书馆一学期借阅业务大数为基础,随机抽样1400份样本数据,运用PCA主成分算法对图书借阅业务大数降维和运用ISODATA聚类算法对降维结果数据集F聚为4类。通过对4类图书借阅业务大数特征提取分析,为高校图书馆订购馆藏图书资源订购提供有效决策。

  • 标签: PCA 算法 ISODATA算法 图书采购策略
  • 简介:摘要在信息化时代,云计算和大数技术为我们的生活、工作提供着重要支撑。面对庞大的数据规模,如何对其进行挖掘和运用是人们所要考虑的。云计算能够有效结合大数挖掘的特点,不但能够有效缓解数据存储的压力,同时还能够将多个用户的数据进行融合存储并实现快速访问,Apriori算法就可以依据用户的兴趣内容对存储于云端的大数进行挖掘。

  • 标签: 大数据平台 关联挖掘算法 发展趋势
  • 简介:摘要:当代云计算数据中心的存储节点数量少则几十万多则上百万,在规模如此庞大的海量存储系统中,节点失效或磁盘损毁已然成为一种常态,此外,由于网络设备或者传输线路故障等原因导致的数据丢失或短时不可用现象也常有发生。如果用户或企业不能随时随地存取自己所需的数据,甚至发生数据丢失的现象,将大大影响客户满意度,甚至给企业带来巨大的经济损失,因此,必须采取有效措施及相关技术策略来保证云端数据的可靠存储。

  • 标签: 云计算 大数据 数据容灾
  • 简介:摘要随着电力需求的增长,智能电网建设也越发完善,大数时代影响下,智能电网信息调度算法也有了多样化发展。下面文章主要从大数的基本概念出发,探讨大数智能电网信息调度算法并提出具体的改进策略。

  • 标签: 大数据 智能电网 信息调度 电网调度
  • 简介:摘 要:本文对遗传算法数据挖掘中的应用进行了广泛的研究,阐明了数据挖掘的定义和常用技术,对遗传算法数据挖掘领域中实现的原理和目前应用进行了详细阐述,并讨论了遗传算法数据挖掘中所面临的问题。

  • 标签:
  • 简介:针对大数处理框架MapReduce中的任务调度问题,提出一种基于Markov决策过程(MarkovDecisionProcess,MDP)的任务调度算法,通过状态集来描述集群中节点的负载和作业的数据本地性需求,使用状态转移函数表示调度策略对状态的影响,采用值迭代求解算法求取最优策略,实现集群中节点的最优调度.实验结果表明,该算法能够保证数据本地性的同时,减少作业响应时间,提高系统综合性能.

  • 标签: 大数据 MAPREDUCE MARKOV决策过程 任务调度