按两个参数进行样本分布的示例
如何确定样本量
当然,理想的样本量是所有受访者,他们都是您正在研究的受众的一部分。然而,对全体人口进行调查非常耗时且昂贵。
而且,按照统计规律,1500人的调查结果和10000名受访者的调查结果会略有不同——只有百分之几。这意味着采集太大的样本是没有意义的——我们需要找到调查参与者数量和误差幅度之间的“黄金分割”。
一项研究的误差幅度 是结果中可以接受的误差百分比。例如,一项调查显示,50%的受众知道您的品牌,但误差幅度为5%。这意味着,在现实生活中,普通人群中大约有50±5%的人熟悉该公司的产品,也就是从45%到55%。
通常,研究的误差幅度为 1% 到 10%。最常见的错误值是 3% 或 5%。它越小,获得可靠结果的概率就越高。
可靠性(置信水平) 是计算样本量的另一个重要指标。它代表调查结果正确的受众比例。
可靠性水平设定在80-99%之间。如果低于 80%,那么这些数据就不可信,因为它对于大多数目标受众来说都是不正确的。
最常用的置信水平是 95%。如果预算允许,可以指定99%或者99.9%,但样本会更大。
因此,影响样本量的主要参数有三个:
误差级别-从1%到10%;
可靠性——从80%到99%;
总人口的规模——可以是已知的,也可以是未知的。
最终数据的可靠性和误差水平由公司根据业务目标和预算规模设定。总人口的规模是由营销人员决定的。如果不知道确切的值,则可能根本无法在计算中显示出来。在这种情况下,样本将以“有储备”的方式计算。
有多种方法来计算适合您研究的样本量 - 您可以自己计算或使用在线计算器。让我们更详细地看一下。
方法一:手动计算
这是一个简化的公式,您可以使用它自己确定样本量。只需将对应于所选置信水平的系数代入分子,将所需的误差大小代入分母即可。这将为您提供需要调查的受访者数量。
该公式并未考虑人口规模。这并不重要,因为对于超过100,000人的庞大受众群体来说,其规模不再影响样本量。
如果您研究的是一个小群体,并且想要减少受访者数量以节省预算,那么最好考虑第二种方法。
方法 2:使用在线计算器
网上有几种不同的样本量计算器选项。例如QuestionStar和 Socioline服务。
它们是一个带有需要填写的字段的窗口,您可 电报数据 以在其中指示统计错误和可靠性的级别。如果知道总人口规模,那么也请输入。
有些计算器有一个“特征在一般人群中的比例”项目。研究开始前尚不清楚其含义,因此无需填写此项。
在计算器中你需要指定误差和可靠性的大小,其余项目是可选的
填写完所有字段后,计算器将给出样本大小值。您可以试验错误和置信度水平来确定调查的最佳受访者数量。
计算表明,对于几乎任何规模的受众,对 100 人的调查会产生大约 10% 的误差,对 200 名受访者来说,误差为 7%,而对 400 名受访者来说,误差约为 5%。给出的数值是置信度为 95% 的数值。
样本大小受边际误差的影响最大
如何创建代表性样本
要创建一个代表您的受众的样本,您需要遵循这些基本步骤。