启发式评估是在用户界面中查找主要和次要问题的好方法。由于可能预期,主要问题比轻微问题稍微更容易找到,具有查找给定的概率主要在六种案例研究中,单一评估员的平均值为42%的可用性问题(Nielsen 1992)。找到给定的相应概率次要的问题只有32%。

尽管主要问题更容易找到,但这并不意味着评估人员专注于主要问题。在六个用户界面(Nielsen 1992)的情况下,启发式评估确定了总共59个主要可用性问题和152个小的可用性问题。因此,显而易见的是,启发式评估发现的可用性问题列表将倾向于被轻微问题所占主导地位,这是一个原因严重程度评级形成对该方法的有益补充。尽管从定义上来说,主要的可用性问题是最需要发现和修复的,但次要的可用性问题仍然是相关的。许多这样的小问题似乎用启发式评估比用其他方法更容易发现。启发式评估发现的这种小问题的一个例子是在用户界面的两个部分使用不一致的排版。同样的信息有时会以衬线字体显示(像这个)有时用无衬线字体(像这个),这样就会降低用户的速度,因为他们不得不花费额外的精力来匹配这两个信息。除非基于大量的录像或记录的交互进行了非常仔细的分析,否则在用户测试中无法观察到这类次要的可用性问题,因为这种减速非常小,不会阻止用户完成他们的任务。

可用性问题可以四种不同的方式位于对话中:在接口中的一个位置,在两个或多个必须进行比较的位置以找到问题,作为界面整体结构的问题,最后是应该包含在界面但目前丢失的东西。对211个可用性问题(Nielsen 1992)的分析发现,四个位置类别之间的差异小而且没有统计学意义。换句话说,评估人员近似善于找到所有四种可用性问题。但是,位置类别和界面实现之间的相互作用效果是显着的并且具有很大的效果。类别中的问题“缺少的东西”比运行系统中的其他问题稍微更容易找到,但比纸质原型中的其他问题更难找到。此发现对应于较早,定性,分析纸张执行中更难找到的可用性问题,而不是在运行系统(Nielsen 1990)中。由于这种差异,在评估纸张模拟时,应该更加困难地丢失对话元素。

对这一现象的一个可能的解释是,使用运行系统的求值器可能会在需要缺少的接口元素时卡住(因此会注意到它),而论文“实现”的求值器只会翻到下一页,并关注在那里找到的接口元素。

交替启发式评估和用户测试

尽管启发式评估发现了许多用户测试无法发现的可用性问题,但它也可能错过了一些用户测试可以发现的问题。如果系统是高度依赖于领域的,并且评估人员几乎没有领域专业知识,那么评估人员可能特别容易忽略可用性问题。在一些来自内部电话公司系统的案例研究中,有些问题是非常特定于领域的,如果没有用户测试,它们实际上是不可能发现的。

由于启发式评估和用户测试都能发现被其他方法忽略的可用性问题,因此建议同时使用这两种方法。因为没有理由花费资源去评估一个有许多已知可用性问题的界面,而这些问题又会再次出现,所以通常最好在两种评估方法的使用之间使用迭代设计。通常,人们会首先执行启发式评估,以清理接口,并尽可能多地消除“明显的”可用性问题。在重新设计界面之后,它将接受用户测试,以检查迭代设计步骤的结果,并发现启发式评估没有发现的剩余可用性问题。

在此处建议的启发式评估和用户测试之间有两个主要原因。首先,启发式评估通行证可以消除许多可用性问题,无需“废物用户”,谁有时可能难以找到和以大量的时间安排。其次,这两类可用性评估方法已被证明找到了相当不同的可用性问题;因此,它们互相补充而不是导致重复的发现(Desurire等人1992; Jeffries等,1991; Karat等人1992)。

另一个例子是,考虑一个用于办公室互连的视频电话系统(Cool et al. 1992)。这样的系统有可能改变人们的工作和互动方式,但这些改变只有在经过长时间的使用后才会变得清晰。此外,与许多计算机支持的协作工作应用程序一样,视频电话需要大量的用户才能进行真实的测试:如果您想呼叫的大多数人都没有视频连接,那么您将不会依赖该系统。因此,一方面实地测试是必要的,以了解用户的长期行为的变化,但另一方面,这种研究将是非常昂贵的。因此,人们会想要用启发式评估和基于实验室的用户测试来补充它们,这样更大的领域人群就不会遭受明显的可用性问题的困扰,而这些问题本可以以更低的成本被发现。这种系统的迭代设计将包括一些持久的“外部迭代”和现场测试,以及大量快速的“内部迭代”,这些“内部迭代”用于在向现场用户发布之前对界面进行优化。

参考文献

  • Cool, C., Fish, R. S., Kraut, R. E.和Lowery, C. M. 1992。视频通信系统的迭代设计。计算机支持的协同工作(加拿大多伦多,11月1-4日):25-32。
  • 德苏维尔,H. W.,康兹埃拉,J. M.和阿特伍德,M. E. 1992。使用实证检验以外的评估方法,有何所得与损失?在人和计算机7,由Monk,A.,尿布,D.和Harrison,M. D.,89-102编辑。剑桥:剑桥大学出版社。本文的较短版本可用在Chi'92展示的短暂谈判摘要(加州蒙特雷,5月7日):125-126。
  • Jeffries,R.,Miller,J. R.,Wharton,C.和Uyeda,K. M. 1991.现实世界中的用户界面评估:四种技术的比较。ACM CHI'91会议论文集(新奥尔良,洛杉矶,4月28日至5月2日):119-124。
  • 克拉特,C.,坎贝尔,R. L.和菲格尔,T. 1992。用户界面评价中的实证测试与演练方法比较。诉讼ACM Chi'92会议(加州蒙特雷,5月3日至7日):397-404。
  • 尼尔森,j . 1990。纸面与计算机实现作为启发式评估的模拟场景。Proc. IFIP INTERACT'90第三Intl。相依人机交互(剑桥,U.K.,8月27日至31日):315-320。
  • 尼尔森,j . 1992。通过启发式评估发现可用性问题。诉讼ACM Chi'92会议(蒙特雷,CA,5月3日):373-380。