学科分类
/ 1
2 个结果
  • 简介:摘要聚类作为典型的数据分析方法,尤其是对大规模数据进行聚类分析成为近年来的研究热点。针对现有序列聚类算法在大数据计算时存在开销大的问题,提出了基于MapReduce的人工蜂群聚类算法。通过引入MapReduce并行编程范式,快速计算聚类中心适应度,基于仿真和真实的磁盘驱动器制造两类数据,对算法的聚类效果进行了验证。实验结果表明,本文算法具有更好的聚类效果。

  • 标签: MapReduce 人工蜂群 聚类
  • 简介:针对工业监测数据在特征提取环节需要处理的数据集越来越大、实效性要求越来越高的问题,设计了一种在云计算平台MaxCompute环境下并行化的排列熵(PermutationEntropy,PE)算法。采用MaxCompute表存储海量的监测数据,基于MaxCompute扩展MapReduce模型设计了并行化排列熵算法,用于海量监测历史数据的批量排列熵特征提取。通过在单机和云计算平台环境下测试,算法具有良好的可扩展性,并可以适应大规模数据集,算法性能与数据量成线性关系。

  • 标签: 排列熵 监测数据 大数据计算服务 MAPREDUCE