学科分类
/ 1
1 个结果
  • 简介:摘要:采用简单的随机抽样方案分析以海量数据为特征的大样本,可能导致估计结果无法有效代表总体,因而产生估计偏差。本文基于样本分配方法如何选择、分层标准和界限如何明确及分层层数如何确定等问题,首先分析抽样理论在海量数据环境下的可靠性,然后比较海量数据环境下每种抽样方法的优缺点,最后重点介绍如何定义分层标记和边界,如何确定层数及如何选择抽样分布方法,了解如何将分层抽样应用于大型数据集,从而设计以大样本为背景的分层抽样设计方法,探讨分层抽样方法在海量数据分析中的主要特征。

  • 标签: 分层抽样 大样本 海量数据