重叠的信息类别和令人困惑的标签是这是网站设计中最普遍的两个问题。幸运的是,有快速有效的技术您可以使用它来创建对您的用户有意义的类别和标签。

最著名的技术可能是卡片分类,其中用户将代表内容项列表给出组和标签,因为它们认为合适。卡排序对于了解您的观众思考,但它不一定会产生应遵循的确切分类方案。例如,卡片中的参与者通常会创建一个通用类别以容纳一些似乎不适合其他任何物品的物品;这是可以理解的,但如果您在菜单中实际包含“其他东西”类别,同样的用户将避免像瘟疫一样。(网站游客令人惊奇地愿意点击模糊的标签,因为他们非常怀疑他们必须做大量的工作来筛选内容。)

为获得最佳结果,应通过树测试跟踪卡排序以评估所提出的菜单结构。

定义:树的测试通过让用户在树中找到特定任务可以完成的位置,评估层次类别结构或树。

树测试非常有用作为卡片排序的后续,因为它:

  • 根据其在真实情景中的执行方式评估层次结构,使用类似于可用性测试的任务;和
  • 可以在设计页面布局或导航菜单之前很好地进行,允许廉价地探索和改进菜单类别和标签。

要进行树测试,您不需要绘制任何线框图或编写任何内容。你只需要准备两件事,或分层菜单,以及任务,或者向研究参与者解释他们应该尝试寻找什么。

定义了树

您的目录树应该是所有主要内容类别及其所有子类别的完整列表。即使您只对测试树的特定部分感兴趣,但排除其他部分也是有风险的,因为它假定用户知道要转到哪个部分。例如,如果您的网站同时具有产品服务类别,你选择只测试产品树,你会错过发现你的观众是否理解这两个类别之间的差异。

根据你对层次结构的哪个部分最感兴趣,你的树可能需要有3、4甚至5个层次。包括您想要测试的子类别的最低层次的全部深度。每个子类都应该提供该领域的所有选项的完整列表,以便从用户那里引出真实的行为。用户经常通过与附近的替代品进行比较来评估链接标签。例如,对历史记录感兴趣的用户可能会尝试一个类别标签文化- - - - - -但如果还有一个选择历史资源。

竞争树测试:标签vs.位置

如果考虑为同一树类别使用不同的标签,则可能需要测试两个不同的树,以比较术语的执行情况。这种测试特别容易做Userzoom它允许你随机地将参与者分配到树的不同版本,其方式类似于A / B测试在一个现场网站上。如果要测试多个树,请避免在与第二棵树交互时相同的会话中显示相同的用户的两个替代树,这将由其与第一个树进行偏移。

如果您只想比较不同的树,则不需要准备和测试单独的树位置对于标签,例如whether西红柿应该放在水果蔬菜。不必为每个位置测试两棵不同的树,您可以测试一棵树,并比较有多少用户点击了它水果Vs.点击的次数蔬菜. (如果他们两个都点击了,你还可以告诉他们先尝试了哪个类别。)

准备测试:工具和格式

您可以使用纸张原型(或任何可点击的原型工具)进行树测试,但专门为树测试设计的服务将大大加快分析结果的过程,并非常值得。UserzoomTreejack都是进行树测试的好选择。

在电子表格中准备你的树,你可以很容易地可视化和编辑它,然后简单地复制和粘贴整个层次结构到你的树测试工具。电子表格的格式应该是你的主页在列A的顶部单元格,然后从左到右列出较低的层次。确保每行只列出一个类别,以便在导入层次结构时正确解析级别。

包含菜单树的电子表格的屏幕截图
此电子表格显示新墨西哥州政府网站的树木或菜单层次结构。每个类别都显示在一个单独的行上,子类别放在包含它们的父类别右侧的列中。

一旦您将您的层次结构粘贴到测试工具中,类别将被解析并用于自动创建一个可单击的菜单层次结构,其中每个类别都可以展开以显示相应的子类别。

在OptimalWorkshop的Treejack测试工具中创建的树的截图
如上图所示的Treejack这样的树测试工具,将自动将电子表格层次结构解析为带有类别和子类别的可点击菜单。

树测试任务

您要求用户完成的任务与树本身一样重要。首先,您需要决定要针对哪些类别和标签。理想情况下,你应该包括以下目标:

  • 关键网站目标和用户任务,比如找到最重要的产品(主要导航任务的成功率可以作为比较次要任务的基准,以及未来测试的参考点)。
  • 潜在问题领域,例如卡片中的利益相关者或参与者提出的新类别

标签或位置比较-同一类别的任何替代标签或位置。对于您编写的每个任务,您还应该定义正确的答案,对应于信息在树中的实际位置。这些信息允许测试工具自动计算每个任务的成功率。

在Userzoom的树测试工具中为任务标记正确位置的示例
Userzoom树测试系统的此屏幕用于指示特定任务的正确答案是哪个类别。

任务措辞

每个任务都应该测试一个类别标签,要求用户找到该类别中包含的内容。与可用性测试任务一样,树测试任务说明应该避免使用泄露答案的术语。预防启动有时可以通过描述场景和动机来完成,但也要记住,用户可能不会仔细阅读说明,如果它们被掩埋在一个冗长的故事中,很容易错过重要的细节。

作为一个例子,这里有一些不同的措辞来评估创业新墨西哥州政府树的类别(如上图所示):

  1. 查找有关启动业务的信息。
  2. 明年你将搬到圣达菲,一旦你搬到那里,你想通过开一家提供草坪护理服务的副业来补充收入。找出你需要遵守的规则。
  3. 您正在考虑开设草坪护理服务。查看此网站上是否有任何资源可以帮助您开始此过程。

第一个例子通过使用确切的标签术语来赠送答案,创业;而第二个单词很长,并且充满了多余的单词,如果用户快速浏览的话,很容易将其误认为任务的主要内容。第三种方法避免了标签术语和误导性的细节。

采油树测试的局限性

采油树测试通常作为一个远程,不降额研究。后招聘代表用户,您只需将它们发送到学习的链接,并且测试工具通过使用自己的计算机完成任务的过程来浏览它们。测试工具比人类更好地保持轨道恰好究竟是哪个类别用户点击。

但是,此格式不会捕获用户行为的完整背景(例如在执行任务时进行的评论),并且您无法提出个性化的后续问题。

为了将格式的影响降到最低,至少要进行一些调节飞行员会话在收集大部分数据之前。在这些审核会话中,您可以确保任务措辞是可以理解的,并且还可以有机会接收可能在定量数据中难以发现的细微差别。例如,在最近的树测试中,我们注意到在飞行员测试中,许多用户避免了他们会话上半年的某个类别,因为标签如此广泛地宽阔,他们担心内容将是压倒性的。由于任务订单随机化,在定量结果中,这种趋势并不明显,但是当您完成每个会话并在用户忽略一个明显的选择后,它非常明显。仅凭洞察力一天都让飞行员测试得很好。

您还可以通过在树测试之后进行一个简短的调查来部分弥补无法提出后续问题的问题。与其让用户回忆他们觉得困惑的标签,不如给他们提供一份标签清单,让他们检查哪些标签难以理解。这个问题可以用an开放式的问题邀请用户分享任何进一步的评论和反馈,以引出意想不到的假设或误解,这可能在点击历史中不明显。

结论

树测试专注于评估类别标签。这既具有巨大的实力和显着的弱点。由于用户与视觉造型和内容完全互动的菜单,因此该体验显着不同于与完整设计进行交互。例如,设计大型的菜单提供了比在树测试中测试的浏览体验相当不同,因为它同时显示了几个子类别的内容。

然而,通过仔细的数据分析,甚至这些固有的限制通常都可以克服或最小化——例如,关注用户是否选择了正确的顶级类别,而不是关注大型菜单网站的成功率。

总的来说,这些限制是为了能够在设计过程的早期快速迭代和评估信息层次结构的主要结构更改而付出的小代价。您可以创建一个全新的树来测试,只需编辑您的电子表格-完全不需要设计或编码。