非概率抽样及其主要形式

版次：03 来源：中国信息报 2021年06月24日

　　■ 李金昌

　　非概率抽样是抽样中与概率抽样相对应的一种类型。顾名思义，它不是基于概率判断而是凭借人们的主观判断或根据便利性原则来抽取样本。非概率抽样的最大特征是总体中每个个体被抽取的可能性难以用概率来计算，或者每一种样本组合被抽取的概率事先无法确定和计算。

　　虽然非概率抽样难以保证总体中每一个个体都有事先可计算的非零概率被抽取，但在一定条件下还是能够依据样本对总体数量特征作出大致的估计，只是难以判断该估计是否无偏以及估计的误差有多大。在概率抽样出现以前，人们就是借助非概率抽样来了解总体数量特征的。非概率抽样的主要形式包括随意抽样、判断抽样、定额抽样、滚雪球抽样和流动总体抽样等几种。

　　随意抽样也称任意抽样或便利抽样，它是调查者利用现有的名册、号簿和地图等资料来抽取样本，或者利用偶遇的方式选取调查单位。例如，利用电话号簿抽取居民家庭进行民意调查、在街头路口随意对一些过往行人进行商品需求调查等就属于随意抽样。这种抽样简便易行，但往往由于抽样框与目标总体不一致（名册不全、老化或包含了异质个体等）或样本只限于某特殊类型个体（不同路口的过往行人可能在职业、受教育程度等方面有较大差异）而导致样本偏差较大、代表性不高。特别需要注意的是，不要把随意抽样等同于随机抽样，两者虽一字之差但却完全不同，因为后者属于概率抽样。

　　判断抽样又称立意抽样，它由调查者凭借自己对调查对象的了解和经验判断、有意识地从总体中选取一个“有代表性”的样本，也即样本由若干被认为有代表性的个体所组成。这种抽样形式最早由挪威首任统计局长凯尔于1895年提出并积极倡导，他认为样本代表性高低不取决于样本容量的大小而是取决于获取样本的方式。这种抽样可以充分利用调查者的专业判断经验和已掌握的有关信息，避免产生极端的偏误；但不同的人会做出不同的判断，主观随意性较大，对调查结果也缺乏评估的客观标准，估计误差也难以计算和控制。事实证明，要用判断抽样形式抽取一个真正有代表性的样本并非易事，因为事先对总体中的所有个体作出是否具有代表性的判断极为困难，特别是大的总体。

　　定额抽样也称配额抽样，它是判断抽样的改良形式。它先对调查总体按一定标志进行分组或分类，然后按比例分配各类（组）应该调查的个体数，最后再每类（组）分别用判断抽样形式抽取各自有代表性的样本。很显然，只要分类符合意图，那么这种形式就有利于提高样本的代表性。1936年，盖洛普公司就是用这种抽样形式成功预测了美国的总统选举，仅用容量为5000的样本战胜了《文学文摘》杂志容量为1000万的样本，而后者恰恰采用了基于电话号簿和俱乐部名单的随意抽样（没有涵盖低收入群体）。配额抽样虽然在形式上与分层抽样很接近，但后者各层样本都随机抽取、都属于概率抽样。配额抽样易于组织实施，适用于调查者对总体相关特征比较了解、能对之进行符合意图分类（组）且样本量较大的情况，但依然难以避免判断抽样所具有的缺点。

　　滚雪球抽样是一种针对特殊总体进行调查的抽样形式。在无法编制抽样框的情况下，只能先找到几个符合条件的个体，然后通过这些个体顺藤摸瓜、找到更多符合条件的个体，使样本如同滚雪球般由小变大，直至达到一定的容量。滚雪球抽样多用于总体信息不足、个体稀少的情况，调查费用一般不高，但样本容易产生偏差。

　　流动总体抽样采用“捕获—放回—再捕获”的方式来估计动态变化总体的某些数量特征。例如，要估计某湖泊的鱼资源量，先从湖中随机捕获一部分鱼，分别称重并做记号后放回该湖，过一段时间待鱼群充分流动混合后，再捕获一定数量的鱼，观测其中曾被做记号的鱼的数量与重量并计算比重，据此推断该湖泊的鱼资源量。这种抽样适合于自然生物总体调查，但同样存在样本容易出现偏差、估计误差难以评判等缺点。

　　作为一种补充，非概率抽样在实践中具有一定的应用价值，只要相关条件具备也能取得比较好的结果。

　　（作者单位：浙江财经大学）