XML地图 黑帽SEO培训为广大SEO爱好者提供免费SEO教程,致力于SEO优化、SEO服务
首页 > SEO培训 » 搜索引擎用户查询意图分析

搜索引擎用户查询意图分析

2018-10-12T11:21:58 | 人围观 | 关键词:搜索引擎用户查询意图分析--SEO培训


  用户查询意图分析
 

  “得天下有道:得其民,斯得天下矣;得其民有道:得其心,斯得民矣;得其心有道:所欲与之聚之,所恶勿施,尔也。”
 

  [图片]孟子·《论民本》
 

  搜索引擎与用户交互的界面非常简洁,用户输入查询词,搜索引擎返回搜索结果,过程看似简单,背后其实复杂。用户输入的每个查询词都隐含了其深层次的查询意图,而这些查询意图往往需要深入挖掘才能获得。
 

  用户查询意图分析目前是搜索引擎研究的焦点领域,只有准确了解搜索用户到底想要什么,提供满意服务才会成为可能。本章主要介绍与用户查询意图分析相关的技术领域。首先介绍用户的搜索行为及用户查询意图的分类,接下来介绍对搜索日志的不同处理方法,搜索日志是目前搜索引擎广泛采用的深入挖掘用户意图的有效数据源,很多技术手段都是以此作为基础的。在本章后续两节将介绍相关搜索及查询纠错这两个非常常见的搜索引擎功能。
 

  9.1 搜索行为及其意图
 

  搜索行为目前已经成为了每个上网的人的基本需求,但是用户的搜索行为是怎样一个过程?隐藏在用户查询背后的搜索意图是什么?这都是需要仔细研究的领域,只有这样才能提供更好的用户体验。
 

  9.1.1 用户搜索行为
 

  用户之所以会产生搜索行为,往往是在解决任务时遇到自己不熟悉的概念或者问题,由此产生了对特定信息的需求,之后用户会在头脑中逐步形成描述需求的查询词,将查询提交给搜索引擎,然后对搜索结果进行浏览,如果发现搜索结果不能完全解决用户的信息需求,则会根据搜索结果的启发,改写查询,以便更精确地描述自己的信息需求,之后重新构造新的查询请求,提交给搜索引擎,如此形成用户和搜索引擎交互的闭合回路,直到搜索结果已经解决了自己的需求或者尝试几次无果而终。图9-1是描述这种用户搜索行为的示意图。
 

  
 

  从上述过程可以看出,从用户产生信息需求到最终形成用户查询,中间有很大的不确定性,用户未必能够一开始就找到合适的查询词,即使是找到了,也可能存在查询词不能完全描述信息需求的情形,即在形成查询的过程中存在信息丢失的问题。所以后续循环中的查询改写就是用户逐步澄清搜索需求的一个过程。
 

  常见的查询改写有3种方式:抽象化改写、具体化改写及同义重构改写。抽象化改写将原来的查询进行语义抽象,比如原先的查询是“东北虎照片”,经过抽象化改写成为“老虎照片”,因为“老虎”在语义概念层次上要更加宽泛,包含了“东北虎”这个概念,所以是一种抽象化的过程,之所以要做这种类型的改写,往往是因为原先查询找到的东西太少,通过概念泛化增加搜索的召回率,以此方式找到更多的内容。
 

  具体化改写正好与此相反,从宽泛的语义概念下行收窄,比如将查询“室外活动场所”改写为“踏青场所”,改写后的查询更加具体,这么做可以更加精确地定位查找内容。
 

  同义重构改写则保持改写前后的查询含义不变,比如将查询“旧汽车”改写为“二手汽车”,两者代表的含义是相同的,用户如此改写往往是对原先查询的搜索结果不满意,所以换了一种同义说法来搜索。
 

  9.1.2 用户搜索意图分类
 

  用户发出的每个搜索请求背后都隐含着潜在的搜索意图,如果搜索引擎能够根据查询词汇自动找出背后的用户搜索意图,然后针对不同的搜索意图,提供不同的据查询词汇自动找出背后的用户搜索意图,然后针对不同的搜索意图,提供不同的检索方法,将更符合用户意图的搜索结果排在前列,无疑会增加搜索引擎用户的搜索体验。目前搜索引擎已经部分实现了这种搜索模式,比如用户搜索“北京 天气”的时候会主动将当天的气温等情况列在搜索结果最前面。图9-2是这种方法的一个结构示意图。
 

  
 

  应该将用户意图分为哪些类型,目前并没有明确标准可言,不过很多工作都受到了Broader等人的意图分类工作的影响,他们通过人工分析查询,将搜索意图分为3个大的类别。
 

  1.导航型搜索(Navigational):这种搜索请求的目的是查找具体的某个网站地址,比如著名公司的网址或者机构的主页等,其特点是想要去某个网页。
 

  2.信息型搜索(Informational):这种搜索请求的目的是为了获取某种信息,比如“如何做宫保鸡丁”、“美国现任总统是谁”等,其特点是用户想要学到一些新知识。
 

  3.事务型搜索(Transactional):这种搜索请求的目的是为了完成一个目标明确的任务,比如下载MP3、下载软件或者在淘宝购物等,其特点是想要在网上做一些事情。
 

  Broader的搜索意图三分法非常有影响力,但是失之于粗糙。雅虎的研究人员在此基础上做了细化,将用户搜索意图划分为如下类别。
 

  1.导航类:用户知道要去哪里,但是为了免于输入URL或者不知道具体的URL,所以用搜索引擎来查找。
 

  2.信息类:又可以细分为如下几种子类型。
 

  · 直接型:用户想知道关于一个话题某个方面明确的信息,比如“2010年诺贝尔物理奖获得者是谁”或者“为何星星会发光”等。
 

  · 间接型:用户想了解关于某个话题的任意方面的信息,比如粉丝搜索“李宇春”等。
 

  · 建议型:用户希望能够搜索到一些建议、意见或者某方面的指导,比如“如何才能戒烟”等。
 

  · 定位型:用户希望了解在现实生活中哪里可以找到某些产品或服务,比如“买电话卡”等。
 

  · 列表型:用户希望找到一批能够满足需求的信息,比如“北京中关村附近的饭店”等。
 

  3.资源类:这种类型的搜索目的是希望能够从网络上获取某种资源,又可以细分为如下几种子类型。
 

  · 下载型:希望从网络某个地方下载想要的产品或者服务,比如“下载Win7”等。
 

  · 娱乐型:用户出于消遣的目的希望获得一些有关信息,比如“下载电影”等。
 

  · 交互型:用户希望使用某个互联网软件或者服务提供的结果,比如“北京 天气”,用户希望找到一个网站,在这个网站上可以查询北京的天气情况。
 

  · 获取型:用户希望获取一种资源,这种资源的使用场合不限于电脑,比如“折扣券”,用户希望搜到某个产品的折扣券,打印之后在现实生活中使用。
 

  上述是对用户意图的人工整理分类,至于具体技术实现,则可以采取一些通用的分类算法比如SVM、决策树等完成。
 

相关内容推荐:

Top