像字体、颜色、对齐和图像这样的视觉细节越来越被期待不仅仅是创造可用的体验,而且也是表达复杂的品牌特征例如友好、可靠或创新。
许多团队从定义目标品牌特征;然后设计师和利益相关者选择他们认为最能传达这些品牌特征的视觉细节。这种方法假设设计师和利益相关者的意见能够准确预测用户的反应。这是一个伟大的第一步,但它不能保证设计师认为看起来“友好”的东西会被用户所感知。
当组织可以从有效的品牌建设中获益良多时,审美选择及其对用户态度的影响应该通过严格的、数据驱动的方法进行评估。
如何测试视觉设计的感知
和任何形式的用户体验研究一样,招募测试参与者他们代表了你的目标受众。他们不需要任何设计专业知识——人们不需要在视觉设计方面的培训来知道他们是否喜欢某样东西;事实上,用户可以在不到十分之一秒的时间内确定他们对视觉效果的喜爱程度(根据吉特·林德加德和她的同事的一项研究)。然而,知道某人是否喜欢一个设计不能表明这个设计是否传达了正确的品牌品质。
(另外,让我们强调一下,这也不是一个有效的标准,不管你是否喜欢这个设计,或者你是否认为它表达了目标特征。你不是用户你的团队中的其他成员和你的管理层也不会。)
要衡量品牌认知,不要仅仅询问人们是否喜欢某个设计,而要使用更结构化的方法,包括两个主要部分:
- 暴露在视觉刺激下:向研究参与者展示视觉设计,可以是静态图像、原型,也可以是实时互动网站或应用程序。
- 评估使用者对刺激的反应:使用开放式或严格控制的问题来衡量用户对设计的反应。
呈现视觉设计测试刺激
您使用的“测试刺激”(即设计的视觉表示)可以很容易地用于几种不同类型的研究研究。当进行面对面的视觉设计评估,您可以简单地向人们展示一个静态图像,或者打印在纸上,或者显示在屏幕上。打印的页面应该是真实的大小,而超过2个屏幕的页面通常以数字形式评估更好,因为打印出来的页面一次显示的内容比用户在屏幕上实际看到的要多得多。如果你想要获得关于特定视觉设计的即时第一印象的反馈,就使用静态图像。
审美和品牌印象也可以用遥远,不加节制的方法,它允许与难以亲自接触的用户进行测试,或者与大量用户进行测试(当您需要对结果有高度的确定性时,这很有用)。任何可以显示图像的调查工具都适用于远程评估。
如果你感兴趣的话第一印象,将视觉刺激短时间呈现给用户。有两种方法可以实现这一目标:
- 5秒钟测试:通过这种测试,你展示刺激5秒钟(或在另一个短时间内)。这种方法最适合准确捕捉人们的本能反应。5秒的观看时间对于阅读文案或注意具体字体或颜色等细节来说太短了,但对于形成准确反映视觉风格的印象已经足够了。
- 首先点测试:在参与者接触设计之前,你给他们一个具体的指示(比如“了解更多关于这个组织的信息”),当他们点击屏幕上可以完成任务的位置时,你就会阻止他们。大多数用户仍然只会花几秒钟的时间在这种类型的测试上,但他们不会故意查看整个页面,而是会搜索与特定任务相关的功能或链接,而只查看设计的其余部分。如果您希望用户在第一次接触您的站点时已经有了一个明确的目标,那么这个测试是最适合的。
这两个测试是最容易远程管理的,使用诸如5秒测试和Userzoom(用于5秒钟的测试)或Chalkmark(首先点测试)。
请记住,在第一次点击测试中,你提供的确切任务说明肯定会影响参与者对视觉设计的注意和记忆。如果您的用户可能在您的站点上有各种各样的目标,那么将用户随机分配到几个不同的任务指令中,或者坚持更中立的5秒测试。
比较多种设计变化
通常情况下,向用户展示一种以上的可能的视觉设计可以帮助他们识别他们喜欢(或不喜欢)的每个变化。如果你要求参与者评估多个设计,一定要改变他们看到备选方案的顺序,因为人们的部分反应可能会受到他们首先看到的版本的影响。(例如,如果一个版本更容易理解,那些先看到一个版本的人就会了解其中的内容,而不会对其他版本感到困惑。)跟踪每个人最先看到的版本,以便在分析响应时考虑到它。
此外,当要求用户评估同一设计的不同版本时,差异必须显著到足以让外行人立即察觉到.微小的变化,如字体大小的微小变化或类似字体的替换,对视觉设计师来说可能是显而易见的,但对一般用户来说往往是察觉不到的。让人们有意识地识别和评估这些微妙的细节很可能会混淆他们,浪费你的时间。(更糟糕的是,你可能会成为查询效果在这种情况下,用户编造一个答案只是为了满足问题,即使他们对两个过于相似的版本并没有真正的感觉不同。)
评估用户反应:开放式vs.结构化
一旦参与者接触到设计,下一步就是测量他们的反应。人们的审美印象可能非常独特,需要系统地分析,以确定有意义的趋势。这可以通过开放式反馈来实现,但使用稍微更结构化的方法可以更容易地理解整体模式。以下是一些可以使用的技巧,从完全开放的到高度结构化的:
- 开放式的偏好的解释:要求用户解释为什么他们喜欢设计
- 开词的选择:要求用户列出3到5个词来描述设计
- 闭词选择(合意性测试):为用户提供一个术语列表,让他们挑选最适合描述设计的词
- 数值评分:收集关于设计在多大程度上展示了特定的品牌品质的数字评级
开放式的偏好的解释
第一种方法,简单地要求人们解释为什么他们喜欢(或不喜欢)一个设计,可以很好地与积极性高、能言善辩的用户进行面对面交流。这个问题覆盖了最广泛的网络,如果你不太了解你的听众的期望,想要发现什么对他们来说是重要的,那么这个问题会很有用。它还可以帮助识别基于个人特质的观点(比如“我喜欢紫色”),这样你就可以把注意力集中在更实质性的因素上。这种方法的缺点是,如果参与者没有积极性或不是很清楚地表达,您可能只会得到简短或不相关的回应。这种方法在未调节的远程设置(如调查)中尤其危险,因为如果有人给出“很好”之类的模糊回答,你就无法在后续问题中询问更多细节。
开词的选择
一个稍微更结构化的评估用户感知的方法是让测试参与者列出几个描述该设计的词.这种形式可以确保你至少得到一些具体的反馈,同时仍然保持问题的开放性,以发现你可能没有考虑到的、但对你的听众很重要的因素。你可能会得到各种各样的描述符,你需要仔细分析它们以确定有意义的主题。这种分析的一个好方法是将术语按一般的积极、消极或中性分类,然后将含义相似的术语分组,并评估它们是否与你的目标品牌属性相匹配。例如,下表显示了一个企业对企业网站的描述符,该网站的品牌目标是值得信赖、与时俱进和有帮助。这些术语都没有被研究参与者指定为描述符,但许多用户将设计描述为简单的(有正面和负面含义)。
积极的 | 中性 | 负 |
---|---|---|
简单的 简单的,大胆的 专业、整洁 企业 优雅的 人类 |
清醒的 三方 三部分 |
平淡无奇 乏味的,典型的,安全的 太简单了 简单的,通用的 平原 基本 过时的 太多的信息 临床 |
开放式的选择词问题引出了广泛的描述词,必须对这些描述词进行分析,以确定它们是否有效地表达了所需的品牌特征。
结构词的选择
要求用户从术语列表中选择描述符您提供的是选词方法的受控变化。通过向用户提供有限的词汇集,这种方法特别关注目标品牌属性是否被参与者感知。你希望传达的品牌特征应该包括在你的术语列表中,以及其他描述矛盾或不同品质的选择。结构化的词汇选择(也称为“合意性测试)在发现新观点方面没有开放词汇选择那么敏感,但却更容易比较不同版本的设计,或不同受众群体对同一设计的反应。这种技术在面对面的研究中效果很好,你可以让用户跟进问题,让他们在解释选择每个术语的理由时参考设计。它也可以用于远程研究中,但它不是一个好主意结合“5秒钟”测试格式,因为通过一长串的话可能要花这么多时间,由用户去他们不记得很多关于设计只看到5秒钟。相反,可以使用调查工具,让人们在从列表中选择单词时看到设计。
品牌认知的数字评级
最后,最可控的方法是收集关于每个品牌特质表现得如何的数字评级的设计。为了避免冗长的测试过程,选择3-5个最重要的品牌品质,并让人们评价每个品质在设计中体现得如何。(问题越多,问卷就越难,随机回答的几率就越大。)因为这种模式限制了发现不同观点和反应的能力,只有当你在之前的研究中找到了最普遍的看法,并只是想评估每个品质的相对强度时,数字评级才合适。
最后,关于焦点小组:虽然它们可以用来捕获用户的偏好,但如果您没有一个有才华的、经验丰富的焦点小组协调人可用,这种方法是有风险的。从小组对话中的每个参与者那里获取关于视觉设计的详细反馈是很困难的。一个有帮助的策略是,要求参与者在集体讨论之前写下自己的看法,并收集这些书面评论供以后分析。而且焦点小组并没有捕捉到任何行为信息。
在可用性测试中评估视觉设计美学
以上所述的所有方法都特别注重视觉印象;但现实是,人们并不是孤立地遇到视觉设计,而是作为整体体验的一部分,其中还包括内容和交互。用户体验的每个维度都会影响其他维度:更多美观的设计通常被认为更实用.同样,用户的交互设计影响人们对品牌特征的认知选择:一个乍一看看起来简单和受欢迎的设计,如果人们不知道如何使用它,可能很快就会变得令人困惑和沮丧。
虽然第一印象很重要,但并不能说明一切。你还应该评估视觉设计如何影响用户的行为和任务成功当它们与系统交互时。事实上,细微变化的影响,比如略微增加标题大小,可能只有在人们实际使用系统时才会很明显;乍一看,他们可能甚至没有注意到差异,但当浏览一篇文章时,较大的标题可能会让你更容易快速跳转到特定的部分。这种行为的改变可能会再次提高用户查找相关信息的能力,让他们更喜欢这个网站。人们甚至可能会说写作更好(因为他们读了更多感兴趣的信息),即使实际副本保持不变,唯一的变化是排版。
幸运的是,典型的可用性测试协议可以很容易地修改,以合并对视觉设计的评估。你可以在常规的可用性测试中包含一些关于视觉印象甚至文字选择的问题。然而,这些不是试图捕捉用户的第一印象,而是应该进行审美评估后研究的行为可用性部分已经完成.
顺序很重要,因为如果你在会议开始时询问别人对视觉设计的看法,你就有可能使研究的行为部分产生偏差。特别是当用户浏览了多个版本并选择了一个“收藏”版本时,他们很可能会忽略或尽量减少在“收藏”版本中遇到的任何问题。
不要在会议开始时询问用户对视觉设计的看法,而是让人们先完成行为任务,然后关注与视觉设计相关的行动或自发的评论。例如,在最近对我们公司网站原型的测试中,我们要求用户完成正常的可用性任务,比如寻找内容。在尝试一个任务时,一个用户不经意地评论说新的导航菜单在页面的顶部有帮助。这个菜单实际上并不是这个设计的新功能——它是这个用户过去经常访问的网站上的菜单,现在以较轻的字体显示,没有大写字体。
一旦基于任务的研究部分完成,你可以转向评估用户对品牌特征的看法。他们的答案不会完全基于视觉印象,就像他们在5秒的测试中那样,但视觉、内容和互动组合形成的印象实际上更接近于用户在现实世界中的反应。
视觉印象应该单独测试,还是作为可用性测试的一部分?
对于交互式系统,永远不应该评估视觉偏好而不是可用性测试。如果你只有时间和资源来做一个测试,那就做一个可用性测试,并添加一些技术来评估视觉设计的效果。
考虑使用本文中描述的独立方法:
- 时间和资源允许多种类型的测试
- 视觉和品牌认知可能会显著影响产品的成功
- 在测试一个交互式原型之前,要比较不同的视觉方法
- 在测试了一个交互式原型后,以更大的用户样本来确认结果
参考文献
Lindgaard, G., Fernandes, G., Dudek, C.和Brown, J.《注意网页设计师:你有50毫秒的时间来创造一个良好的第一印象!》行为与信息技术,25(2),2006。https://www.tandfonline.com/doi/abs/10.1080/01449290500330448
Rohrer,基督徒。合意性研究:测量视觉设计的审美反应。xdStrategy.com, 2008年10月28日。http://www.xdstrategy.com/2008/10/28/desirability_studies/
分享这篇文章: