介绍

分析网站搜索日志是用户体验研究中最大的错失机会之一。注重外部搜索优化(获得访问),较少关注网站搜索优化(服务访问者)。

网络搜索引擎可以提供一些网站搜索统计数据。这是你搜索流量的外部视图,显示哪些术语和网站为你的网站带来流量。如果你选择添加一些脚本到你的页面,这些大型引擎和分析服务也可以给你一些关于你的网站内部流量的信息。但是它通常不够详细,而且通常你不能以你想要的方式查看数据。

然而,如果你的网站上有搜索引擎,你可能有自己的搜索数据,集中在你的网站内部流量。网站搜索日志文件包含大量关于网站访问者的信息,以及他们想从您的组织获得什么。

搜索引擎和搜索日志

用户体验研究者最感兴趣的搜索引擎是专注于你自己网站的页面和链接的网站搜索引擎,而不是那些索引整个网络(谷歌,Bing,百度等)。

搜索引擎可以生成一个日志(文本文件),其中包含用户在搜索工具中键入的所有问题和术语的列表。日志还包含关于每个搜索查询的有用信息,比如用户的IP地址或其他标识符以及请求的时间,这意味着如果按用户标识符和时间对列表进行排序,通常可以在一个人的会话中查看搜索序列。谷歌搜索设备的日志示例

为什么要分析搜索日志数据

搜索日志分析可以帮助利益相关者与网站访问者产生共鸣,因为数据显示人们很难找到他们需要的东西。这些信息可以帮助获得对改进网站的支持,因为它通常说明了经常遇到的问题和不做重大工作就很难解决的问题。但是,有些问题很容易修复,日志也显示了这些问题。

搜索数据可以影响:

  • 广告策略
  • 内容策略
  • 传入的交通流量
  • 信息架构(IA)
  • 本地化战略
  • 导航设计
  • 新的目标受众
  • 搜索引擎优化(SEO)
  • 搜索结果页面的可用性
  • 网站上的词汇

大多数搜索引擎允许你强迫好的结果(最好的赌注对于一个给定的查询),一旦你弄清楚哪些查询需要这种帮助。它们也允许你制作同义词的关系例如,这一功能有助于克服拼写错误,或将品牌术语与通用术语联系起来。你可以通过各种方式改变搜索引擎的功能搜索-引擎调优

如何让搜索日志有用

询问您的系统管理员或IT部门您的组织是否保留搜索引擎日志。如果没有,要求打开日志,这样你就可以每6个月左右查看一次日志,寻找可用性的线索。

分析几个月的搜索日志是个好主意,这样你就可以把奇怪的事件放在上下文中,比如广告活动或新闻文章发布时出现的关键字峰值。

在尝试分析数据之前,从日志文件中提取关键信息。如果您熟练使用脚本语言和命令行工具,您可以自己从这些文件中提取有趣的信息。如果没有,请询问下面列出的数据类型。将这些列表放入电子表格的不同标签中,这样你就可以标注它们,并突出感兴趣的项目:

1.获得一个包含3-6个月前1000个查询词的列表.按照频率(该项在日志中出现的频率)对它们进行排序。

把你不懂的或想知道的东西都标出来。标记任何你知道的网站不提供。在分析前300个左右的术语时,请进一步查看列表中的术语同义词因为彼此或自然聚集在一起类似的意义或实用程序

如果您看到许多术语具有相似的含义,将数据复制到一个新工作表中,并根据含义或共享任务对术语进行分组。例如,您可能会找到一组相关术语,如:自动取款机位置,工资支票,银行,发薪日,工资单,直接存款.这种群集可以帮助你改进网站上的内容分组、建立交叉链接、创建“看也链接”列表或帮助建议最好的赌注搜索结果页。

电子表格屏幕截图显示按查询数量排序的术语,以及推荐、所有者、状态和首选目标URL的其他列
搜索日志的格式因搜索引擎的不同而不同。下面是使用电子表格从日志中提取数据的一个示例。还可以包含许多其他数据点,比如搜索结果页面的排名、您的评论等等。几乎相同的条款,可能会带来相同的结果,比如假期假期,如果这些数据按项排序,将很容易找到和计数在一起。在其他表中根据含义、类别、所有者和用户标识符对术语进行聚类也非常有用。

2.按照IP地址或用户标识符对日志数据的另一个副本排序,然后是时间戳.有些系统使用cookie或其他唯一标识符来指示特定的浏览器,而不是依赖IP地址。根据用户标识符和时间戳对日志数据进行排序,可以查看谁搜索了多个术语。这些用户会话可以帮助您了解人们的词汇选择,阐明术语的自然集群,帮助您了解人们在寻找什么,并允许您找出哪些搜索查询是有效的或无效的(例如,对相关术语的重复搜索可能表明查询是无效的)。

例如,在宠物商店网站上,你可能会看到,在5分钟内,有4个来自相同用户标识符的查询:犬类玩具骨头。我们可以合理地猜测,这个人想要找到狗玩具,更确切地说,是狗骨头,而前三个问题并不能满足这一需求。

为了验证这一假设,您可以重做搜索并查看结果页面。如果您能够访问这一分析数据,您可能会发现同一用户是否在同一分钟内购买了商品或进入了购物车。

即使你所拥有的只是搜索数据,你也可以评估搜索词和序列中搜索词的结果的质量,然后决定是否应该改进这些结果,以便像这个人这样的人可以用更少的搜索成功。您还可以查看频繁搜索数据,以了解有多少人在搜索骨头及其他相关事宜(咀嚼玩具生牛皮等),你可以在网站上查到是否有狗骨头。

做这样的研究可以在很多方面改变网站:搜索调优、信息架构、产品描述、可见的代表性产品、搜索页面上的自我广告促销,以及商店推出的新产品

请注意:相同的IP号码有时对应的是服务器,而不是特定的人的设备。当IP地址不唯一时,大多数分析软件使用“用户会话”(一个IP地址或用户ID与网站接触的时间,例如15-20分钟),试图将IP地址映射到网站访问。如果你看到来自一个IP地址的数千次访问,那很可能不是一个狂热的粉丝或机器人,而是一群坐在某个公司、ISP或代理服务器的一个IP地址后面的许多人。类似地,学生群体、网吧访客、机场kiosk用户和酒店客户经常共享同一浏览器和电脑。

3.获得没有结果的搜索词列表.这些查询通常会指出拼写错误和搜索引擎由于某种原因无法找到的所需信息。那些只被使用过几次的词汇并不会引起人们的兴趣,但是任何搜索次数很多的词汇都可能指向你可以解决的问题。

考虑到在无结果页面上发送消息.至少,它应该显示网站导航、包含查询的搜索工具,以及这些建议:检查拼写,尝试不同或更少的术语。如果你看到人们在搜索一些你知道网站没有的东西,考虑为一些指向人们需要的资源的术语提供定制的结果。例如,如果搜索引擎只搜索支持网站,但人们显然在主网站上寻找内容,为他们指明正确的方向,或将搜索传递给主网站,并提供他们需要的内容。

4.获取最长查询的列表.这些搜索词通常是完整的句子搜索,可以帮助阐明一些在顶部查询中使用的单词搜索词。有些问题是不相关的,但有一些问题可能非常有趣和有帮助。如果你有很多长时间的问题,考虑把你的搜索框长一点可以让更多的字符同时出现在视野中。

您可以从搜索日志中获得的见解

除了最热门的术语(最想要的信息),您还可以从搜索数据挖掘中发现意想不到的见解和新的研究问题。特别是,你可能会发现:

1.人们想要却找不到的东西

使用IA,搜索引擎优化,创建最佳选择(你将结果强制放在搜索结果页面的顶部),受欢迎的链接列表,常见问题

发现的例子:在一个健康产品电子商务网站上,一个月内有11750人在搜索加热垫,但只有13人买了。您可以猜测搜索和导航对于这种产品类型都是无用的。你的测试搜索这个词返回热敷和厨房热垫。商店里有电热垫,但都在一个叫冷热疗法发现下家庭急救。

可能的行动

  • 在加热垫附近找到热敷件。
  • 在搜索引擎中添加同义词,这样当有人搜索加热垫他们得到热疗法产品。
  • 加热垫直至搜索结果的顶部(最好的选择).
  • 添加加热垫产品描述。
  • 在主页中添加一个链接最受欢迎的产品部分加热垫那去家庭急救
  • 有些事情是不可能马上做的,所以你添加了一个问题和答案常见问题页与链接到家庭急救
  • 建议该公司多携带一些加热垫品牌,并增加一个加热垫着陆页。

2.人们想要的东西却不存在

使用:内容策略

发现的例子: 3个月内搜索27840人有机鸡汤,有机鸡汤,有机鸡汤有机鸡。然而,食物和食谱网站上并没有关于这个主题的任何文章或食谱。

可能的行动

  • 现在你知道了人们想要什么和网站提供什么之间的差距,优先为这个主题创建一些内容。
  • 考虑一些现有的内容是否也适用于有机,如果是,则在人们搜索时显示,例如显示最佳选择或搜索建议(当有人在搜索框中键入时显示的搜索列表)。
  • 如果人们想要的超出了你网站的任务范围,利用这个证据来驱动链接,广告,或与满足这些访问者需求的内容提供商的合作策略。

3.用户的词汇量和网站的词汇量之间的差异

使用搜索引擎优化、搜索引擎调优、导航、内容改进和术语表术语

词汇错配问题经常发生在使用品牌术语、首字母缩略词或可爱的标签而不是通用术语的网站上。一些网站也可以从添加其他语言的同义词中获益。

发现的例子:人们在一个关于热门巧克力产品的评论网站上经常搜索黑巧克力,但网站更关注的是黑色巧克力黑色海岸,它们不会出现在黑巧克力搜索结果。

可能的行动

  • 把单词黑暗巧克力在所有适当的页面上。在搜索引擎中添加同义词黑暗黑色
  • 更改导航标签以包括这两个黑色黑暗,(如果你在导航中使用了品牌术语,那么就使用通用术语.)
  • 编写内容,以关键语言告诉访问者关于巧克力的类型和常用术语,以及这些类型如何映射到品牌,包括定义、链接和描述,其中包含你在搜索日志中找到的适当的单词。

4.人们经常拼错的术语和其他结果很差的术语

使用:调整搜索引擎,并提出适当的最好的赌注(将搜索结果强制放在搜索结果页面的顶部)

发现的例子:根据搜索日志,首席科学家名字最常见的拼错(第谷)tyko.当你做一个测试搜索第谷,你会发现排名靠前的是新闻稿,而不是科学家的传记和工作页面。

可能的行动

  • 为所有的拼写错误添加搜索同义词第谷
  • 为她的名字加上一个最好的结果首席科学家在搜索结果的顶部显示了她的传记页面。

5.最常见的术语是无术语

使用:没有术语或空白术语需要调查

可能的原因:在一些网站上,没有关键词的搜索就会一无所获。人们用它来解决糟糕的搜索或糟糕的信息架构。在其他网站上,这一发现可能是由于搜索工具看起来很奇怪或有意想不到的行为,所以人们在戳这个小工具时不小心触发了搜索。如果“no term”实际上不是空的,而是由许多类似于______________的条目组成,请尝试在浏览器的Unicode视图中显示日志。这些查询可能是非ascii字符集中的查询。翻译成谷歌翻译,看看发生了什么。

6.最长的查询显示客户苦恼或黑客企图的证据

使用:需要调查并可能升级

针对客户困境可能采取的行动

  • 改变产品或服务。
  • 在FAQ中添加相关材料。
  • 更改产品文档并添加支持材料。
  • 返回自定义搜索结果或建议,以便在搜索关键字时呼叫支持。

黑客攻击:如果最长的搜索是巨大的字符块或看起来像代码、命令或无意义的东西,立即报告给您的安全团队或系统管理员。所有形式都应该对它们所接受的字符的数量和类型进行限制。

7.许多常用的术语都是数字

使用:内容策略,网站特色

可能的原因:数字搜索通常用于产品标识符。如果您在日志中看到大量的产品编号,而您的搜索引擎在进行测试搜索时没有找到这些产品,那么可能是时候实现产品编号搜索功能了。

如果人们正在搜索电话号码或部分电话号码,他们可能需要找到联系信息,如姓名、部门和地址,因此测试这些结果,看看它们是否足够有用。如果您看到有人在内部网上搜索电话号码,那么可能是时候实现一个人们搜索

根据你的调查结果行事

如前所述,通常需要调整搜索引擎的词汇和拼写错误。您可能还需要添加一些页面重定向。

运行前100个查询并捕获结果的第一页。注意是否发现了任何有用的东西。如果页面上有一些好东西,但它在页面上的位置并不高,那么考虑一下如何提高它的排名。利用这些数据最好的赌注对于一些查询,并隐藏导致人们错误信息的嘈杂结果。

对于发现的可能导致更大变化的问题,如新特性、新内容、不同的信息体系结构或涉及产品、支持、安全等的更大问题,请与其他涉众共享您的发现。理解搜索洞察力可以成为改进许多组织流程的催化剂。

跟踪那些需要用其他方法进一步研究的问题和发现,然后推销这些项目。

IP地址和用户标识符的隐私危险

IP地址和其他用户标识符对于用户隐私来说是非常敏感的,因为它们可以(但不总是)对应于特定的人和机器。如果您的系统管理员不给您原始日志数据,这就是原因。一些国家有严格的隐私法,限制使用唯一标识符进行网站跟踪,所以这些数据可能无法获得。顺序搜索是搜索日志分析需要惟一标识符的唯一原因,因此您仍然可以在没有该信息的情况下进行大量分析。

如果委托您处理具有个人身份信息(PII)的原始日志,请不要失去对这些数据的控制,不要将包含PII的未加密日志发送到电子邮件中,不要将日志放在全球可读的位置,即使在公司内部也不行。在与任何人共享日志数据之前删除PII,并在分析日志之后销毁日志。

结论

搜索数据为用户体验研究、网站策略和营销提供了丰富的重要信息。花点时间找到你的,看看它。您可能会发现用户的行为会让您感到惊讶,并改变组织正在做的事情。搜索数据可以通过帮助您提出非常重要的问题并找到需要解决的大问题来加强您的用户研究工作。

更多的信息

我们一天的课程继续进行数据分析与分析

路易斯·罗森菲尔德搜索分析罗森菲尔德媒体,2011年7月.数字ISBN: 1-933820-04-7

信息检索会议