启发式评估是发现用户界面中主要和次要问题的好方法。正如人们可能预期的那样,大问题比小问题更容易找到,找到一个给定问题的概率是多少主要在六个案例研究中,单个评估者的可用性问题平均占42% (Nielsen 1992)。找到一个给定条件的相应概率问题只有32%。

虽然主要问题比较容易发现,但这并不意味着评估师只专注于主要问题。在6个用户界面的案例研究(Nielsen 1992)中,启发式评估总共确定了59个主要的可用性问题和152个次要的可用性问题。因此,很明显,启发式评估发现的可用性问题列表将倾向于由次要问题主导,这是原因之一严重性评级形成对该方法的有益补充。尽管从定义上来说,主要的可用性问题是最需要发现和修复的,但次要的可用性问题仍然是相关的。许多这样的小问题似乎用启发式评估比用其他方法更容易发现。启发式评估发现的这种小问题的一个例子是在用户界面的两个部分使用不一致的排版。同样的信息有时会以衬线字体显示(像这样的)有时用无衬线字体(像这样的),这样就会降低用户的速度,因为他们不得不花费额外的精力来匹配这两个信息。除非基于大量的录像或记录的交互进行了非常仔细的分析,否则在用户测试中无法观察到这类次要的可用性问题,因为这种减速非常小,不会阻止用户完成他们的任务。

可用性问题可以位于一个对话在四个不同的方面:在单一位置接口,在两个或两个以上的位置,必须找到问题相比,是一个问题的总体结构界面,最后是应该被包括在接口但目前下落不明。对211个可用性问题的分析(Nielsen 1992)发现,四种位置类别之间的差异很小,没有统计学意义。换句话说,评估者在发现所有四种可用性问题方面的能力大致相同。然而,位置类别与界面实现之间的交互作用是显著的,且影响非常大。与运行系统中的其他问题相比,“缺失的东西”类别中的问题更容易找到,但却比纸上原型中的其他问题更难找到。这一发现与早期对可用性问题的定性分析相一致,这些问题在纸质实现中比在运行的系统中更难发现(Nielsen 1990)。由于这种差异,我们在评估纸质模型时应该更仔细地寻找缺失的对话元素。

对这一现象的一个可能的解释是,使用运行系统的求值器可能会在需要缺少的接口元素时卡住(因此会注意到它),而论文“实现”的求值器只会翻到下一页,并关注在那里找到的接口元素。

交替启发式评估和用户测试

尽管启发式评估发现了许多用户测试无法发现的可用性问题,但它也可能错过了一些用户测试可以发现的问题。如果系统是高度依赖于领域的,并且评估人员几乎没有领域专业知识,那么评估人员可能特别容易忽略可用性问题。在一些来自内部电话公司系统的案例研究中,有些问题是非常特定于领域的,如果没有用户测试,它们实际上是不可能发现的。

由于启发式评估和用户测试都能发现被其他方法忽略的可用性问题,因此建议同时使用这两种方法。因为没有理由花费资源去评估一个有许多已知可用性问题的界面,而这些问题又会再次出现,所以通常最好在两种评估方法的使用之间使用迭代设计。通常,人们会首先执行启发式评估,以清理接口,并尽可能多地消除“明显的”可用性问题。在重新设计界面之后,它将接受用户测试,以检查迭代设计步骤的结果,并发现启发式评估没有发现的剩余可用性问题。

这里建议的启发式评估和用户测试之间的交替有两个主要原因。首先,启发式评估通过可以消除大量可用性问题,而不需要“浪费用户”,这些用户有时很难找到并安排大量的时间。其次,这两类可用性评估方法发现了相当不同的可用性问题集;因此,它们相互补充,而不是导致重复的发现(desurvir等人1992;Jeffries et al. 1991;Karat等,1992)。

另一个例子是,考虑一个用于办公室互连的视频电话系统(Cool et al. 1992)。这样的系统有可能改变人们的工作和互动方式,但这些改变只有在经过长时间的使用后才会变得清晰。此外,与许多计算机支持的协作工作应用程序一样,视频电话需要大量的用户才能进行真实的测试:如果您想呼叫的大多数人都没有视频连接,那么您将不会依赖该系统。因此,一方面实地测试是必要的,以了解用户的长期行为的变化,但另一方面,这种研究将是非常昂贵的。因此,人们会想要用启发式评估和基于实验室的用户测试来补充它们,这样更大的领域人群就不会遭受明显的可用性问题的困扰,而这些问题本可以以更低的成本被发现。这种系统的迭代设计将包括一些持久的“外部迭代”和现场测试,以及大量快速的“内部迭代”,这些“内部迭代”用于在向现场用户发布之前对界面进行优化。

参考文献

  • Cool, C., Fish, R. S., Kraut, R. E.和Lowery, C. M. 1992。视频通信系统的迭代设计。计算机支持的协同工作(加拿大多伦多,11月1-4日):25-32。
  • 德苏维尔,H. W.,康兹埃拉,J. M.和阿特伍德,M. E. 1992。使用实证检验以外的评估方法,有何所得与损失?在人和计算机7, Monk, A.,尿布,D.和Harrison, m.d., 89-102。剑桥:剑桥大学出版社。这篇论文的简短版本可在在CHI'92发表的简短谈话摘要(加州蒙特雷,5月7日):125-126。
  • Jeffries, R., Miller, J. R., Wharton, C.和Uyeda, K. M. 1991。现实世界中的用户界面评估:四种技术的比较。ACM CHI'91会议论文集(新奥尔良,洛杉矶,4月28日- 5月2日):119-124。
  • 克拉特,C.,坎贝尔,R. L.和菲格尔,T. 1992。用户界面评价中的实证测试与演练方法比较。ACM CHI'92会议论文集(加州蒙特雷,5月3日至7日):397-404。
  • 尼尔森,j . 1990。纸面与计算机实现作为启发式评估的模拟场景。Proc. IFIP INTERACT'90第三Intl。相依人机交互(英国剑桥,8月27日至31日):315-320。
  • 尼尔森,j . 1992。通过启发式评估发现可用性问题。ACM CHI'92会议论文集(加州蒙特雷,5月3日至7日):373-380。