这是我教书时经常遇到的一个问题用户访谈是我们UX会议上的一个全天课程我需要面试多少人?不幸的是,没有一个黄金数字。在本文中,我将强调一些有助于您做出决定的因素。

常见的误解

一些UX专家认为使用5个用户进行测试同样适用于基于面试的研究。事实上,对于许多探索性研究来说,5个参与者太少了.另一些人则被教导要每名员工招聘5人角色,这是确保样本具有代表性和足够大的经验法则。然而,这条规则可能会导致更多不必要的面试——尤其是当你有5个或更多角色时。一个有经验的面试官可以从少量的面试中获得深刻的见解。

定量研究可以通过样本大小的计算来告诉我们需要招募多少参与者以便对更广泛的人群有信心地进行概括。但访谈是一种定性研究方法。定性研究目的是详细了解人类的经验,而不是确定有多少人有一个特定的经验或表达一个特定的需求。(这是后续定量研究可以告诉我们的。)不可能知道完全有多少参与者就足以获得这种深入的理解。

饱和

在定性研究中,样本量通常是由所处的点决定的饱和是达到了。

定义:在定性研究中,饱和是主题从研究中得出的结论已经足够充实,因此进行更多的访谈不会提供改变这些主题的新见解。

(游戏邦注:关于饱和度,不同的学派有不同的解释,但这超出了本文的讨论范围。)

经过一定数量的采访后,回报会递减——关于研究主题的新信息很少。这就是达到饱和的点。

折线图左边显示的是新见解的数量,y轴显示的是参与者的数量,x轴显示的是参与者的数量。这条线开始时急速加速,然后迅速变细。图上开始变细的那一点被突出显示为饱和点。
随着越来越多的参与者加入研究,对研究主题的新见解就会越来越少。

在为可用性测试招募用户时也会出现同样的饱和现象。当对11项研究中发现的可用性问题进行建模时,Jakob Nielsen和Tom Landauer发现用5个人发现了85%的可用性问题在被测试的界面中,随着每个新的参与者加入到样本中,新的可用性问题越来越少。

然而,在基于访谈的研究中,我们希望了解人们的经验和需求,而不是在界面中发现问题。因此,由于我们所收集的信息种类具有更多的可变性,所以饱和点通常高于用户测试。因此,5次面试往往是不够的。

不幸的是,对于需要多少面试参与者才能达到饱和,学术研究人员并没有达成共识。例如,马克·梅森分析了2000多篇博士论文的摘要,这些论文利用了定性访谈,发现样本量从少到多,从少到多,从少到多。虽然样本中位数为31,但标准差较大:18.7。多年来,研究人员根据自己的经验提出了不同的样本量建议。这些建议从5条到50条不等。市场研究人员Abbie Griffin和John Hauser分析并建模了从他们关于便携食品携带设备的访谈中发现的客户需求数量,并估计20-30次访谈通过揭示所有客户需求的90-95%达到饱和。研究人员格雷格·盖斯特、亚文·邦斯和劳拉·约翰逊就性健康的话题对非洲妇女进行了60次采访,并进行了一次专题分析经过6组访谈。然后,在每一轮分析后,他们分析了新代码的数量和代码更改的数量。研究人员观察到,在36种高频信号中代码(导致主题的发展),在6份转录本之后添加了34份,在12份转录本之后添加了35份。此外,在分析了12份转录本后,尽管随后进行了访谈,但创建的代码仍然完整和稳定。这些发现让他们得出结论,在他们进行和分析了12次采访时,饱和已经发生了,但他们承认,如果他们对高层的总体主题感兴趣,6个样本对他们的项目就足够了。(如果这是一个UX项目,出于实际原因,我们会在6次面试后停止。尽管我们可能会错过一个主题和一些更深入的细节,但进行和编写额外采访所需的时间应该花在研究其他紧迫问题上。)

影响饱和度的两大因素

你需要面试多少人来达到饱和取决于:

  • 研究目标的广度和范围
  • 研究人群的多样性

与小范围研究目标和同质研究人群的研究相比,一个非常具有探索性并以多样化研究人群为目标的研究项目将需要更多的访谈来达到饱和。例如,一项研究可能需要20-30人(或更多)的样本才能看到饱和度。这是因为人口非常多样化(从年轻人到老年人,从健康到疾病),研究的范围(获得医疗保健的经验)相当广泛。另一方面,观察研究II型糖尿病患者在接受治疗的经验可能需要只有5面试,因为它有一个较小的范围(接受治疗特定疾病)和更多的同质性研究人群(每个参与者患有相同疾病和将收到相同或非常相似的治疗)。

当然,还有一些额外的因素会影响饱和度。这些包括:

  • 面试官有多有经验:有经验的面试官可以通过问一些精心设计的探索性问题和后续问题来获得更多的见解可以在分析数据时发现更多主题。
  • 招聘的参与者有多少专业知识:在某一特定领域有丰富经验的人将能够分享更多相关信息。
  • 面试是如何结构化的:如果面试是非结构化的,那么相同的话题或问题可能并不总是涵盖在每次面试中,这使得样本较少的面试更难达到饱和。如果访谈是半结构化的,并且每个访谈参与者都被问到同样的少数开放式问题,那么很有可能会出现重叠和过早达到饱和。

考虑这些因素可以让你知道你的样本量。

从小处着手,边做边分析

因为我们很难提前知道什么时候会达到饱和发现的时间往往太短在美国,最好从一个小的代表性样本(比如5-6个)开始,然后分析你的面试。如果你仍在学习新内容并生成新代码,你可以招募更多参与者,直到你的主题完成,并在每次新面试中发现一些新见解。

确保你招募的人是你的目标受众,并强调可能影响你的研究问题的相关特征。例如,如果你正在研究在线预订度假的端到端体验,相关特征可能包括收入、旅行频率和年龄。这些特征会影响人们的偏好、态度和行为。

当然,如果可以的话,最好混合性别、年龄和种族,但由于基于访谈的研究样本较小,你的样本不太可能在所有人口统计学因素上与一般人口的比例相匹配——这也没关系!某些特征在样本中会被过多地呈现。例如,如果你关心包容设计时,你的样本中应该有大量数字技能和易访问性需求较低的人。

最后,如果你需要在开始面试前设定一个样本大小(为了预算或因为利益相关者想知道),请给出一个范围。通过这种方式,你可以设定期望值,如果你提前达到饱和,你就可以停止。

总结

多少面试才算足够取决于你什么时候达到饱和,而饱和又取决于你的研究目标和你研究的对象。为了避免做过多的采访,从小处着手,边做边分析,这样当你学不到新东西时就可以停下来。

参考文献

艾比·格里芬和约翰·r·豪瑟,1993年。顾客的声音。市场营销科学12卷。1号。

格雷格·盖斯特,亚文·邦斯和劳拉·约翰逊,2006年。面试多少次才够?一项关于数据饱和和可变性的实验。场的方法,第18卷第1期,59-82页。

马克梅森。2010。使用定性访谈的博士研究的样本大小和饱和度。论坛:定性社会研究,第11卷第3期。https://doi.org/10.17169/fqs-11.3.1428

Nielsen, Jakob, and Landauer, Thomas K.:“一个发现可用性问题的数学模型。”1993年ACM INTERCHI会议论文集(荷兰阿姆斯特丹,1993年4月24-29日),第206-213页。