聊天机器人是机器人的穷亲戚智能助手

定义:聊天机器人是一个特定于领域的、基于文本的对话界面,支持用户执行有限的任务集。

在其他地方,我们讨论了智能助手的6个品质:语音输入、自然语言处理、语音输出、智能口译、代理和集成所有先前的功能。聊天机器人只需要具备以下两个属性:自然语言处理和智能解释。换句话说,聊天机器人应该能够接收自然语言的查询,并正确理解和解释它们(然后执行它们)。

在当今世界,聊天机器人的发展和普及至少受到三个不同因素的推动。首先,有希望通过用机器人取代人工代理来降低客户服务成本。第二,基于会话的系统的成功,如微信提出了将聊天机器人作为与企业和服务的互动渠道的想法,旨在补充现有的渠道,如移动网络和移动应用程序。最后,Alexa和谷歌Home等基于语音的智能助手的流行,促使许多企业在较小规模上模仿它们。

这些因素映射到目前可用的两种不同类型的聊天机器人上:

  • 客户服务机器人在企业与其客户之间的聊天交互中承担一些人力负载。这类机器人的例子包括联合包裹的Ask UPS和阿拉斯加航空的Ask Jenn。
  • 互动机器人旨在为客户服务以外的目的提供与企业交互的额外渠道。例如,达美乐比萨机器人允许用户点披萨;Progressive的Flo生成一个汽车保险报价。这种互动机器人可以在各种平台上使用,最著名的是Facebook Messenger。(其他平台包括Twitter和Slack。)不过,它们也可以在应用程序中使用(美国银行(Bank of America)的Erica)或通过短信使用(Capital One的Eno)。
UPS chatbot页面
UPS.com使用聊天机器人解决客户服务问题。

Kiehl的Messenger聊天机器人:用户可以通过在发送消息文本框或选择屏幕上显示的选项(发送位置邮政编码;的主菜单文本输入框下方的选项)。

虽然客户服务机器人通常是纯文本的,但交互机器人将文本与可视化UI元素结合起来作为一种交互方法。

学习

为了了解聊天机器人的可用性,我们招募了8名美国参与者,要求他们在手机(5名参与者)和桌面(3名参与者)上执行一系列与聊天相关的任务。其中一些任务涉及与人或机器人进行客户服务聊天,其他任务则针对Facebook Messenger或基于短信的聊天机器人。

对机器人的态度

一般来说,人们对机器人的态度从中立到稍微积极。互动机器人是一个相当模糊的渠道:在我们的美国研究中,大多数参与者以前没有与此类机器人进行过互动,他们也不知道它的存在。相反微信官方帐户页面通常是这些机器人的复杂版本,我们的中国参与者对它们很熟悉。有些参与者惊喜地发现了这个互动渠道,也有些人觉得比起其他传统渠道,如网页或手机应用,它并没有带来足够的价值。

客户服务机器人通常被认为不如人类代表有用,但我们的参与者也认为它们有一些优势。最重要的优势是速度:与人聊天通常需要很长的等待时间(要么在队列中,要么在对话开始前,要么在人寻找客户问题的解决方案时),而机器人可以是即时的。另一方面,人们认为与真人接触表明公司关心其客户:“真人真的很好。他们卖给你的是昂贵的商品,所以他们不得不在代理商身上花更多的钱。”另一个人说:“如果你有一个人(为客户服务),这意味着你足够关心;如果你有一个机器人,你应该有一个非常好的。”

交互机器人通常很容易识别为机器人,但客户服务机器人更难识别。有些企业并不总是事先向客户披露他们正在与机器人进行交互. 我们认为这是一个错误。我们的研究参与者对使用机器人的业务透明感到高兴,因为他们可以校准自己的期望和语言。例如,当用户意识到他们在和机器人说话时,他们倾向于更直接,使用基于关键字的语言,避免使用礼貌标记。这种语言通常比正常对话中经常使用的复杂、间接的语言更为成功。

交互聊天机器人的ui

交互样式

文本和链接/按钮都可用于将信息输入交互聊天机器人。它们的用途略有不同:

  • 预定链接和按钮节省了用户的打字时间。这些内容通常显示在旋转木马中,并可能包含图像。人们喜欢使用这些选项,甚至希望它们用于普通输入。
  • 文本允许用户在选择他们想问的问题类型时有一定的灵活性,并允许他们偏离聊天机器人的脚本(通常过于严格)。

这两种输入机制都很重要,它们都应该存在

当机器人不允许用户选择选项,而是要求他们打字时,用户就会抱怨。例如,一名参与者对Booking.com机器人很恼火,因为它不允许他选择日期,他必须输入日期。在输入“感恩节”后,他说:“它应该是一些显而易见的东西。”选项应该是预先填充的——这样做很乏味。我可以按下按钮。”

人们更喜欢选择一个选项(左图是Domino的聊天机器人),而不是输入冗长的文本(右图是Booking.com)。考虑为最常见的输入创建按钮。

一些机器人删除了完全键入文本的选项,迫使用户选择屏幕上显示的选项之一。这种类型的设计使机器人类似于一个网站,并限制了用户可以在系统内探索的路径。

汽车经销商聊天机器人不允许用户在选择该选项后输入免费文本库存选项

链接和按钮在得到明确信号时效果最好人们希望能够点击交互机器人显示的几乎所有非文本元素。例如,当eero Messenger机器人展示了一组图像以说明eero所做的事情时,我们的大多数研究参与者都点击了它们,希望得到更多的信息。

Eero for Messenger(左):为了告诉我更多信息,机器人显示了一个旋转木马,其中包含多个图像和一组可能的连续体(圆形框中的文本)。用户希望能够点击旋转木马项目,但这些不是链接。Kielh for Messenger(右):旋转木马中的大图像不可点击,但它们下面的链接可点击(了解更多现在)。

除了常规按钮和链接外,一些互动聊天机器人还有一个菜单元素,选中该元素后,会显示一组可能的任务。该菜单有时显示在输入文本框下方,有时在旁边显示为一个小汉堡图标。

金州勇士队有一个主菜单链接在输入框下。选择此链接将显示一组可用任务。当用户开始在输入框中输入时,菜单图标就显示在它旁边。的主菜单Link和汉堡包图标做了同样的事情。

其他链接有时会显示在消息框下方。这些链接相当容易被发现:我们的一些用户与它们进行了互动;但是,输入框旁边的图标不太可能被使用。

CNN机器人:消息区域下方的链接表示聊天机器人中的一些主要任务(Top Stories, Topics, Settings).

线性流

交互聊天机器人似乎最像Alexa skills:它们被设计用来引导用户完成少量任务。机器人支持的任务最好被概念化为线性流,具有有限数量的分支,这些分支取决于可接受的用户答案。机器人问一个问题,答案有助于机器人在ri上前进流的右分支。

订购食物的决策树;根据食物类型选择不同的分支;然后是该食物后续选项的节点(例如,比萨饼的外壳)
一个机器人可能为了完成任务而前进的线性流程的例子

当用户符合流程并提供符合系统期望的“合法”答案时,没有跳过步骤或使用未知的单词,体验就会感到成功和顺畅。例如,一些参与者能够成功地与Domino 's Pizza、Wingstop、Progressive的聊天机器人进行互动。但是,一旦用户偏离了指定的脚本,就会出现问题。

例如,当Domino 's Pizza机器人问她的位置是公寓还是房子时,参与者输入乡间别墅机器人回答说对不起。我似乎很难理解。另一个用户正在寻找巴宝莉腰带“带”在消息框中,但收到了有关订单取消的信息。当她把它提炼成“女子带”她被告知从链接列表中进行选择,但没有一个链接与她试图查找的内容相匹配。

巴宝莉的聊天机器人在理解用户试图完成的任务时遇到了困难,并在机器人的指令表中列出了这些任务。

机器人也很难从问题或意外输入中恢复,有时会迫使用户从树的顶端重新开始,做更多不必要的工作来获得答案。例如,我们的一个用户想知道起亚是否有四轮驱动的电动车型。她不得不遍历整个决策树找到匹配的任务,回答诸如汽车需要容纳的人数和MPG等问题。当她对身体风格偏好回答“不”,而不是选择其中一个显示选项时,机器人就会停下来,强迫她重新开始。

这段视频显示,用户正在与起亚汽车的聊天机器人进行互动,以确定起亚汽车是否搭载四轮驱动电动汽车。(在大多数浏览器中,如果控件还不可见,可以将鼠标悬停在视频上以显示它们。)

然而,一些机器人程序更灵活,能够理解偏离脚本的请求。例如,一名参与者意识到多米诺比萨饼公司正在进行促销活动,因此能够将其应用到他的购物车上。他还能够改变一个比萨饼的外壳,他在后期订购。

Domino的Pizza聊天机器人能够满意地响应不属于订购Pizza主要线性流程的请求。左图:用户可以在订购之前对其购物车进行交易。右图:用户在订购的两个比萨饼中,改变了其中一个的外壳。

一些机器人难以做出假设和建立查询的上下文。例如,我们的一名参与者试图与Eno互动,Capital one的基于短信的机器人。他碰巧有两张Capital one的信用卡,每次他问问题时,机器人都强迫他澄清查询所指的账户,w不需要将上下文从一个交互转移到下一个交互。

当一个新任务开始时,机器人通常也不能利用之前输入的信息。例如,我们的一位参与者首先决定叫披萨外卖;她输入了地址,但被告知达美乐不在那里送货。她又开始了,这次的目标是去商店取货,而不是送货。机器人再次询问她的地址,显然完全忘记了她已经输入了地址。

Capital One的机器人Eno要求用户在每个问题之后澄清他问的是哪个账户。左:Eno只识别了用户查询中的关键字“transaction”(尽管拼写错误),无法回答用户的特定问题;相反,它给出了一个匹配任务的答案。右:Eno重复了之前问的问题。

大多数时候,当机器人只能处理可能的输入的子集时,它们会预先枚举它们,让用户选择一个。然而,在WebMD机器人的案例中,人们不知道机器人能够提供哪些药物的信息。例如,机器人不知道Zomig或Escitalopram药物,但能够回答有关Lexapro的问题。据推测,这个机器人只对一部分药物起作用,但列表太长了,无法显示。然而,这个设计决定让机器人毫无用处——没有办法提前知道机器人会帮助完成什么类型的任务。

用简单的线性过程处理复杂的任务,用户害怕遗漏. 他们怀疑通过机器人能得到最好的答案。例如,我们的一位参与者担心Progressive的Flo无法提供他有资格享受的所有折扣;其他参与者想知道Booking.com或Travelocity上的机器人是否能让他们对酒店房间或航班做出明智的决定。的确机器人只有有限的展示空间,它们不太可能向用户显示查询的所有匹配项。人们几乎没有理由相信摆在他们面前的东西就是他们所需要的。Booking.com确实允许用户根据自己的喜好对房间进行排序和过滤,但是,除非用户有非常具体的限制,否则这样的过程不太可能将候选名单缩小到足够少的数量,以便通过bot旋转木马轻松处理。旋转木马,机器人用来显示结果集的UI元素,并不是显示长列表的最佳选择。

Booking.com bot:有太多匹配用户查询的酒店;机器人将一些结果显示在一个旋转木马(左侧)中,并让用户知道在最后一个旋转木马项目(中间)中有80多个结果。虽然分类和过滤是可用的(右图),但不太可能把酒店的数量缩小到足够小,让用户可以使用旋转木马(Facebook Messenger机器人显示结果列表的方式)来选择正确的酒店。

语言

虽然在我们的intelligent-assistant研究我们发现,人们在与Siri、Alexa或Google Assistant互动时仍然倾向于使用礼貌语言。如果参与者意识到他们在与机器人互动,他们通常会放弃礼貌标记(“请”、“谢谢”,间接语言,如“能不能……”)。这种行为有两个可能的原因:(1)聊天作为一种媒介,往往比面对面或电话交谈更直接,可能是因为交互成本(正如一位用户所说,“在聊天中,我不做自我介绍;我不会说“嗨”;我有点不好意思,但我觉得我不需要说再见”);(2)与Siri、Alexa甚至谷歌Assistants相比,这些聊天机器人的人格化程度要低一些,后者都带有人类的声音。

我们注意到,人们与客服机器人的互动方式与交互机器人的互动方式存在差异。客服机器人使用的语言相当复杂大多数时候,人们专注于他们的问题,并试图描述它;他们没有考虑机器人是否能够理解它。当他们得不到满意的答复时,他们往往重新提出同样的问题,而不一定简化它。

相比之下,由于交互机器人通常以任务为中心,并在开始时显示一组可能的任务,人们倾向于使用简化的问题,多句句更少。一些参与者很快意识到“机器人似乎不理解问题,只理解关键字”,但没有必要戏剧性地调整他们的语言;总的来说,我们的许多参与者键入了完整的句子,至少在开始与机器人交互时是这样。

当机器人一遍又一遍地重复相同的答案时,用户通常会感到恼火。UPS机器人警告用户,它将重复一个答案,并提供与真人联系的机会。承认失败并提供逃生舱口(电话号码或一个活跃的经纪人)一般都很受欢迎。意识到一个问题没有被理解是令人失望的,但总比一个明显错误的答案好(“我喜欢(Domino’s Pizza机器人)说‘我不理解’,至少它是诚实的”)。

机器人并不总是能够处理打字错误或稍微模棱两可的表述。例如,Domino的机器人不理解“popperoni”,而Eno,Capital One机器人,不理解“我的声明是什么?”2018年3月?”, misunderstanding “March 2018” for a possible account number. Eno was, however, able to provide an answer for “Can I have my statement2018年3月?”

Capital One机器人Eno不明白用户问题中介词“for”的模糊用法。

有些机器人有个性;例如,Progressive乐队的Flo就很好玩,也很轻盈。然而,一名用户很失望,因为他觉得机器人无法维持这种状态语气在整个对话中始终如一。他说:“她用了一些短语,比如‘现在我们在用天然气做饭’,让它更投入;但一旦它得到了报价所需的实际信息它就没有了;这是非常明确的信息。这可能会有点误导人。一开始你会说,哦,看,它有点个性,但在那之后,我更像是,这就像一个聊天机器人,没有任何意义。它让我摆脱了‘哦,我在用progressive中的flo说话’的概念,而不是我只是在和聊天机器人说话。”

Progressive公司的Flo在收集汽车保险报价信息时,无法保持同样的玩笑语气。

隐私

我们的一些用户担心与互动聊天机器人共享个人数据,如生日、地址、信用卡号码和社会安全号码。他们不确定这些数据是属于隐私还是与聊天机器人的构建平台共享。特别是在Facebook Messenger的情况下,人们看到了我d敏锐地意识到最近的数据泄露:“我有点担心将我的信息放在Facebook Messenger中[…]我会犹豫是否输入信用卡信息;如果能在其他地方输入,那就太好了。”

聊天机器人的价值定位是什么?

客户服务机器人的价值是显而易见的:如果用户的一些问题能够以自动化的方式成功解决,那么企业将会受益。不幸的是,如果机器人太初级,人们会失去对公司的信任,感到被忽视和不被赏识。

对于交互机器人来说,事情就不那么简单了。这些机器人只是复制了网络或移动应用程序中已有的功能。花时间和金钱在这个新频道上值得吗?不太可能——至少在美国和其他传统频道已经确立的国家是这样。正如一位用户所说,“我不认为自己在聊天机器人上完成(这项任务)——也许如果有一些回扣的话……”改善你的网站或应用的用户体验会让你的网站或应用更高投资回报而不是创造一个没用的聊天机器人. 我们发现,即使是好的聊天机器人(可能需要增加开发和测试成本),被发现和认为有用的机会也很小。

首先,大多数用户并不知道聊天作为一个独立的交互渠道存在于Messenger、Twitter或Slack中。当他们想到“聊天”时,他们想到的是“和一个人聊天”。其次,聊天机器人(就像今天实现的那样)的范围相当狭窄通信通道-与网站相比,聊天机器人一次只能显示非常少量的信息(加上,输入信息的效率低于选择信息)。第三,今天的聊天机器人还远远没有显示出任何“智能”——它们感觉上是这样的向导:对于相当简单的任务一步一步的线性过程。

聊天机器人有什么优势吗?在他们目前的化身中,他们只有一个:更少的信息过载。我们的一些用户很惊讶,他们可以这么容易地用聊天机器人点披萨。有了聊天机器人,就不会有太多的干扰和需要关注的信息——只要他们遵守聊天机器人的规则,体验就会很简单。当人们偏离了这些规则,有了复杂的需求,不能用简单的线性流程来解决时,问题就出现了。(一个能简单回答任何用户问题的智能聊天机器人将拥有巨大的interaction-cost优于任何基于web或应用程序的界面。不幸的是,我们离成功还很远。)

从理论上讲,交互聊天机器人对可能重复执行同一类型任务的高级用户很有用——前提是他们发现了这个通道。(chatbot-website关系类似于图形用户界面和一个命令行接口(CLI)在传统的计算机系统:最先进的用户经常喜欢一个CLI的GUI一些任务由于认为打字效率几个简短的命令,而不是支持通过菜单。)但话又说回来,一个设计良好的网站会有现成的快捷方式来帮助高级用户,例如,电子商务网站应该保持用户登录,并允许他们轻松地重新排序项目。我们的一名研究参与者告诉我们:“我不会使用Domino的聊天机器人……在这个网站上,我已经登录了,所以它知道我的地址和支付信息;我不知道这是不是更快。”

也许交互聊天机器人的唯一真正好处是,它们可以作为构建客户服务聊天机器人的一个实验。我们在设计交互聊天机器人时学到的一些经验教训没有理由不转移到客户服务中去。

设计聊天机器人的用户体验指南

  • 在使用机器人而不是人类时要坦率。
  • 清楚地告诉人们机器人可以做什么任务。确保你没有制造错误的期望。
  • 不要过于雄心勃勃:为简单的任务创建机器人。在有限的bot界面中,复杂性没有得到很好的处理。
  • 容忍打字错误和歧义。
  • 允许人们通过自由文本输入和选择链接与机器人互动。
  • 允许排序和筛选,让人们缩小搜索结果的范围。
  • 将信息从一个任务保存到下一个任务。
  • 给机器人编程一些灵活性:推断上下文并允许人们在线性流中向前和向后跳跃。
  • 坦诚地表示不理解。以真人、电话号码或其他互动渠道的链接的形式提供一个逃生通道。