这篇文章是对树测试第1部分:快速迭代评估菜单标签和类别

树测试评估类别和标签信息架构.我们最近解释了这个过程设计采油树测试;一旦你计划好了你的研究,下一步就是收集数据并解释结果。不像自言自语可用性测试,大多数树测试是作为非节制的研究运行的,只生成定量结果。这种方法允许您从大量用户中快速收集数据,但需要一种不同的方法来提取见解。你不能一整天都坐着测试,然后记下笔记,相反,你需要进行系统分析,以确定数据趋势并评估其重要性。

收集数据

研究参与者.就像可用性测试一样,一个好的树测试研究是必须的招聘代表用户作为研究的参与者,特别是针对具有特定目标受众的产品。不要招募大学生去测试一个关于人寿保险的网站。

由于树测试允许您轻松地从大量用户中收集数据,目标至少50名用户,允许用户行为趋势的出现,并最大限度地减少提供低质量数据的无动机参与者的影响。如果你计划测试两棵树并比较它们的表现,你将需要两倍的参与者,因为比较需要一个受试者之间的研究设计(即,不同的人测试每个版本)。

每个参与者的任务.确保每个参与者执行只有10个任务(或更少)。尽管树测试任务可以快速完成,但让人们连续完成30项任务仍然不是一个好主意。当一个人点击同一个菜单15次后,他的心理状态就会与刚刚登陆某个网站、可能从未见过该菜单的普通用户大不相同。如果你需要测试超过10个任务,那就招募更多的用户,并使用树测试工具的随机特性为每个参与者分配10个任务。

初步试验最后,邀请少量用户完成研究,并在将其发送给整个团队之前查看他们的反馈。试点测试可以尽早发现任务措辞中任何意想不到的问题,以便进行纠正。

Tree-Testing指标

一旦结果出来,各种指标就会捕捉到用户理解(或误解)你的类别的方式。TreejackUserZoom,这两种最常见的树测试工具,每一种都使用略有不同的风格来呈现这些指标,但都为您的研究中的每个任务提供了这些定量度量:

成功率:找到该任务的正确类别的用户百分比

直率:没有回溯或尝试任何其他类别而立即进入正确类别的用户百分比

时间:从任务开始到任务结束的平均时间

路径措施:

  • 每个类别的选择频率
  • 首先点击:大多数人首先选择的类别
  • 目的地:大多数人指定为最终答案的类别

根据研究中的树和任务的类型,在预测信息体系结构在现实生活中的表现方面,其中一些指标可能比其他指标更有用。

成功率

为了计算成功率,你必须为每个任务分配至少一个“正确”答案。该任务的成功率表示在树中找到正确位置并将其标识为完成该任务的正确位置的用户的百分比。任何用户选择不同最终位置的试验都被报告为失败。例如,当被要求查找新墨西哥州立图书馆的信息时,100个参与者中有67个选择了正确的位置,这个任务的成功率是67%。

树测试任务的成功率示例
树测试工具计算每个任务的成功率,你定义了一个“正确的”答案。这张来自UserZoom的截图表明,67%的用户找到了任务的正确位置你在哪里可以找到去新墨西哥州立图书馆的方向和时间

从表面上看,成功率似乎很简单:越高越好。但要基于这一指标采取行动,你首先需要一个适当的参考框架,以确定整体树和特定任务的“良好”成功率。

请记住,从本质上讲,树测试消除了许多有用的设计元素,如搜索功能、二级导航选项(如相关链接)和任何来自视觉设计或内容的上下文线索。用户只能看到精简的导航菜单本身。

向树测试参与者显示的用户界面示例
树型测试只向参与者显示任务说明和类别标签的精简菜单,正如您在UserZoom树型测试中的任务中看到的那样。用户没有访问搜索功能,内容,布局,下拉菜单,或任何其他上下文来帮助解释菜单选项。

因为树测试是如此的基础,成功率往往比常规的定量可用性研究低得多。树木测试67%的成功率很容易变成最终设计90%的成功率。(然而,这种增长只会发生在设计的其余部分得到良好执行的情况下;糟糕的搜索实现或糟糕的菜单设计也会将成功率降低到树测试所观察到的水平以下。)

与其期待100%的成功率,不如使用更现实的参考框架来评估每个任务的可接受成功率,考虑以下因素:

  • 该任务对整体用户体验的重要性
  • 与其他类似任务(例如,针对层次结构中相同层次的内容的任务)的成功率比较

例如,考虑下表中的两个任务及其各自的成功率。食品券任务的成功率比其他任务低得多,但这一结果的部分原因是用户必须下钻三层才能找到正确答案。

任务 正确答案(s) 成功率
你在哪里
找到方向
和工作时间
前往新墨西哥州
国家图书馆吗?

公民

>教育

>库

>新墨西哥州图书馆

67%
发现规则
决定
谁有资格
为食品券
在新墨西哥州。

公民

>健康和健康

>一般健康和保健

>人类服务部门

>寻找帮助

>粮食援助

补充营养援助计划

43%

与其比较这两种成功率,更现实的做法是:

  • 食品券任务与另一个任务的成功率,这个任务的目标内容也在6层以下;或
  • 食品券任务的成功率是在两棵不同的树上完成的,这两棵树上有不同的标签——其中一棵使用了这个词粮食援助还有一个是术语食品券。

直接和花费的时间

除了衡量有多少用户到达了正确的位置,还需要考虑他们在这个过程中遇到了多少困难。两个常见的树测试指标表明了这一点:时间,表示用户找到正确答案花了多长时间,以及直率,它记录了有多少用户在没有回溯或改变类别的情况下立即找到了正确答案。直接导航有时也被称为“快乐路径”,因为它意味着顺畅的互动,最少的困惑或绕道。

如果用户在最终找到正确答案之前必须重新执行他们的步骤并尝试多个地方,那么成功率高的任务仍然可能是糟糕的用户体验。例如,考虑这个关于找到学费的任务。尽管有74名用户最终找到了正确答案,但只有50%的用户选择了直接的路径。一半成功的用户在定位之前至少要回溯一次他们所走的路——尽管这些信息实际上在树的三个不同位置都可以找到。

实例树测试结果显示了成功率和直接性
Treejack研究的结果表明,尽管74%的用户成功找到了学费数额,但其中一半的人选择了间接途径,并且至少需要重复一次。

所花费的时间和直接程度都表明了任务对用户来说有多容易。对于新手或临时用户经常完成的任务,直接性尤其重要,因为他们无法从过去的经验中学习和记住位置。

路径:第一次点击最终目的地

成功率和直接告诉你类别是否可找到;详细的路径分析可以帮助你弄清楚如何提高类别这不是很好。

任务的第一次单击是用户开始该任务时首先选择的类别。在树测试中,第一次单击总是顶级类别,因为在选择父类别之前,子类别都不可见。

第一次点击非常关键,因为它通常可以预测用户最终是否会成功找到正确的商品。想象一下,你正在一家购物中心寻找美食广场。如果美食广场在顶层,你开始乘电梯下来,你很快找到它的机会是很渺茫的。但如果你一开始就走到正确的层次,你就有可能四处游荡并找到它,如果只是靠食物的气味的话。

第一次点击以同样的方式操作。一旦用户进入了正确的类别附近,上下文线索和本地导航会让他们更有可能找到它。但不正确的首次点击往往是灾难性的;下表显示了只有20%成功率的任务的首次单击数据。正确的顶级类别,目录,仅收到14%的第一次点击。相反,用户是从程序学校大部分人都在这些区域徘徊再也没能回到目录

只有14%的用户点击了目录作为他们在寻找教授环境法的教师名单时的首选;根据Treejack的研究结果,这导致任务的总体成功率只有20%。

仔细检查第一次点击数据时:

  • 任务的成功率和/或直接性较低。第一次单击表明用户最初希望在哪里找到该信息,并建议将项目移动到哪里(或至少交叉列表)。
  • 最终设计将使用大型的菜单暴露了两个nd和3理查德·道金斯级别类别一目了然。同时查看和比较多个子层次的能力可以大大提高成功率,这比你在树测试中观察到的成功率要高——但这只有在第一次点击成功,用户进入正确的大型菜单时才有效。

如果您有许多任务,其中第一次单击分布在多个类别,那么您可能有太多重叠的类别。进行卡片分类,或者再次查看树测试结果,并寻找其他可能的组织方案。

检查最终目的地用户在第一次点击正确时选择,但成功率很低。这种模式表明较低层次的类别重叠太多。

示例任务结果显示选择每个位置作为最终目的地的用户的百分比
首先点击并确定查找艺术节信息的最终目的地;所有用户都正确地点击了娱乐类别,但35%的用户选择了艺术与文化作为他们的最终目的地,22%的人选择了探索迷人之地.只有30%的人选择正确新墨西哥州发生了什么.这一结果表明,这些兄弟类子类别重叠太多,它们中的任何一个都觉得对用户来说是合适的目的地。

将数据转化为行动

虽然树木测试产生了定量数据,但结论绝不是黑白分明的。任务成功率只是第一步,必须在用户为获得正确答案(直接性)所付出的努力以及他们期望的正确答案(第一次点击)的背景下进行解释。

一旦分析完成,您就可以确定适当的解决方案。例如:

  • 当第一次点击均匀分布在多个区域时,在多个类别中列出主题。如果这个问题出现在许多任务中,考虑改变整个组织方案。
  • 当成功率低,但第一次点击是正确的,改变子类别的标签更明显。

在我们的全天课程中了解更多关于选择组织方案和标签信息架构