XML地图 黑帽SEO培训为广大SEO爱好者提供免费SEO教程,致力于SEO优化、SEO服务
首页 > SEO教程 » 网站页面质量评估:Query-Url质量评估标准

网站页面质量评估:Query-Url质量评估标准

2018-08-29T22:00:21 | 人围观 | 关键词:网站页面质量评估:Query-Url质量评估标准--SEO培训

  百度网页搜索Query-Url质量评估标准

  该文档是query-url质量评估的详细标准指南,内容较详细,当你遇到问题可以随时查看,建议您可以先阅读Part6的快速导读,了解本标准核心内容。

  本文档主体内容包括以下方面:

  ü 评估基础知识:part1、part2、part3;

  ü Query-url打分核心标准:part4;

  ü 分类别举例参考:part5;

  ü 标准快速导读:part6。

  目录

  Part1 前言:百度网页搜索质量评估................................................ 8

  1、评估必备软件........................................................................ 8

  1.1 firefox浏览器................................................................. 8

  1.2 杀毒软件....................................................................... 8

  1.3 adobe flash player、windows media、qvod、百度影音等播放器...................... 8

  1.4 迅雷、QQ旋风、快车(flashget)等下载软件...................................... 9

  2、评估必备基础知识.................................................................... 9

  2.1 什么是query-url质量评估....................................................... 9

  2.2 搜索质量评估的目的............................................................. 9

  2.3 常用术语解释................................................................... 9

  Part2 query-url质量评估概述................................................... 10

  1、Query-Url质量评估介绍............................................................. 10

  2、Query-Url质量评估考虑的维度....................................................... 11

  2.1 相关性:query与结果说的是不是一回事.......................................... 11

  2.2 需求强度:抓住主要需求........................................................ 11

  2.3 丰富程度:详细全面............................................................ 11

  2.4 有效性:能否真正满足.......................................................... 12

  2.5 时效性:新.................................................................... 12

  2.6 便捷性:找到目标信息要花多少时间和成本........................................ 13

  2.7 权威度:英雄也要问出处........................................................ 13

  2.8 总结:不同维度适用query范围.................................................. 13

  3、Query-Url打分分档介绍............................................................. 14

  4、Query-Url打分原则................................................................. 14

  5、Query-Url评估步骤................................................................. 14

  Part3 理解用户需求............................................................ 14

  1、如何判断query需求................................................................. 14

  2、query背后的实际需求意图........................................................... 15

  3、query主体表意是否确定与需求是否多样............................................... 16

  4、query需求的主次之分............................................................... 16

  4.1 主需求........................................................................ 16

  4.2 重要需求/次要需求............................................................. 17

  4.3 小众/冷门需求................................................................. 17

  4.4 特殊情况:泛需求.............................................................. 17

  5、query需求意图类型................................................................. 17

  5.1 寻址需求...................................................................... 17

  5.2 信息需求...................................................................... 18

  5.3 交互操作需求.................................................................. 18

  Part4 五档打分标准............................................................ 18

  1、各档打分定义....................................................................... 18

  2、4分——官方....................................................................... 19

  2.1 4分的定义.................................................................... 19

  2.2 举例说明...................................................................... 19

  2.2.1 4分典型例子............................................................ 19

  2.2.2 没有4分的典型情况...................................................... 22

  2.2.3 有多个4分结果的典型情况................................................ 22

  2.2.4 其他考量................................................................ 23

  3、3分——很好,对大多数人都非常有用................................................. 24

  3.1 3分的定义.................................................................... 24

  3.2 举例说明...................................................................... 24

  4、2分——比较有价值,对部分人较有帮助............................................... 27

  4.1 2分的定义.................................................................... 27

  4.2 举例说明...................................................................... 27

  5、1分——稍沾边,略微有帮助......................................................... 28

  5.1 1分的定义.................................................................... 28

  5.2 举例说明...................................................................... 28

  5.3 表面相关的差结果.............................................................. 29

  6、0分——不相关或无用资源........................................................... 30

  6.1 0分的定义.................................................................... 30

  6.2 举例说明...................................................................... 30

  7、死链............................................................................... 32

  7.1 死链类型:网页安全提示........................................................ 32

  7.2 死链类型:空页面或未能访问页面................................................ 32

  7.3 死链类型:页面报错提示........................................................ 32

  7.4 死链类型:标准报错页面........................................................ 33

  Part5 特定类型打分举例说明..................................................... 34

  1、打分一些重要原则................................................................... 34

  2、query主体是否确定与需求是否多样................................................... 35

  2.1 query主体确定,需求维度单一.................................................. 35

  2.2 query主体确定,需求多样...................................................... 36

  2.2 query主体表意不确定,需求多样................................................ 38

  2.4 特殊说明:需求维度的泛化与具体................................................ 39

  3、特定类型的query打分举例说明....................................................... 41

  3.1 实体类query.................................................................. 41

  3.1.1 名人类.................................................................. 41

  3.1.1 非名人.................................................................. 42

  3.1.2 地点名.................................................................. 42

  3.1.3 公司名.................................................................. 43

  3.1.4 产品名.................................................................. 43

  3.1.5 学校名.................................................................. 44

  3.2 信息类需求.................................................................... 45

  3.2.1 Key-Value需求.......................................................... 45

  3.2.2 原文需求................................................................ 45

  3.2.3 问答类query............................................................ 47

  3.3 交互操作需求.................................................................. 47

  3.3.1 在线预订、购买需求...................................................... 47

  3.3.2 游戏需求................................................................ 48

  3.3.4 图片浏览................................................................ 48

  3.3.5 小说阅读................................................................ 48

  3.3.6 软件下载需求............................................................ 49

  3.3.7 视频观看需求............................................................ 50

  3.4 寻址类型...................................................................... 50

  3.5 其他特定类型query............................................................ 51

  3.5.1 色情需求................................................................ 51

  3.5.2 Url查询的query......................................................... 51

  3.5.3 输入错误的query........................................................ 52

  3.5.4 列表页需求query........................................................ 53

  3.5.5 时效性需求query........................................................ 54

  3.5.6 地域需求query.......................................................... 57

  3.5.7 纯英文query............................................................ 57

  4、特定url页面打分说明............................................................... 57

  4.1 百科类结果.................................................................... 57

  4.2 搜索结果页.................................................................... 58

  4.2.1 什么是搜索结果页........................................................ 58

  4.2.2 搜索结果页的打分........................................................ 61

  4.3 权限页面...................................................................... 62

  4.4垃圾、作弊等低质页面.......................................................... 63

  Part6 Query-Url质量评估快速导读............................................... 70

  1、评估必备软件....................................................................... 70

  2、评估必备基础知识................................................................... 70

  3、query-url质量评估概述............................................................. 70

  3.1 什么是query-url质量评估...................................................... 70

  3.2 Query-Url质量评估考虑的维度.................................................. 70

  3.3 Query-Url打分分档介绍........................................................ 71

  3.4 Query-Url评估步骤............................................................ 72

  4、理解用户需求....................................................................... 72

  4.1 Query需求的主次之分:........................................................ 72

  4.2 query需求意图类型:.......................................................... 72

  5、五档打分标准....................................................................... 73

  5.1 4分——官方.................................................................. 73

  5.2 3分——很好,对大多数人都非常有用............................................ 73

  5.3 2分——比较有价值,对部分人较有帮助.......................................... 73

  5.4 1分——稍沾边,略微有帮助.................................................... 74

  5.5 0分——不相关或无用资源...................................................... 74

  5.6 死链.......................................................................... 74

  6、特定类型打分说明................................................................... 74

  Part1 前言:百度网页搜索质量评估

  欢迎你加入百度网页搜索质量评估团队,作为百度搜索质量评测员,在接下来的日子里,你会参加众多类型的评测任务。本文主要介绍“Query-Url质量评估”的评估指南说明。

  请你接下来花些时间仔细阅读如下内容,这将非常有助于你完成“query-url质量评估”的评测任务。同时,“Query-Url质量评估”是其他众多评测任务的基础,做好该评测类型也将有助于你很好完成其他类型评测任务。

  1、评估必备软件

  为了你能正常进行评估任务,请确保安装如下软件:

  1.1 firefox浏览器

  浏览器是我们工作中最基本的软件。为了保证你正常的工作,请使用firefox浏览器,并且一般升级到最新的版本。可从此处下载:http://www.firefox.com.cn/download/

  但因为firefox对某些页面支持不够好,导致页面内容异常,如遇此情况请更换IE浏览器查看。常见的Firefox支持不够好的页面包括音乐播放页、视频播放页、软件下载页等。如下几个例子:

  ü Firefox不支持迅雷下载需要更换IE:http://kuai.xunlei.com/d/GVKWITFIEELJ

  ü Firefox不支持在线听歌需要更换IE:http://www.2651.cn/Html/2/Play_5880.html

  ü Firefox不支持在线观看需要更换IE: http://www.ddoo.cc/jq/14134/play-0-0.html

  1.2 杀毒软件

  在评估中,你需要浏览打开各种各样的url网页,其中有些可能会含有病毒、损害你的电脑,所以建议你安装好杀毒软件。

  下面一些类型在页面抓取中常常有问题,需要你实际点击url来重新下载查看,这些格式的文件一般安全的,不太可能有病毒,比如:

  ü .txt (text file)

  ü .ppt 或 .pptx (Microsoft PowerPoint)

  ü .doc 或 .docx (Microsoft Word)

  ü .xls 或 .xlsx (Microsoft Excel)

  ü .pdf (PDF file)

  1.3 adobe flash player、windows media、qvod、百度影音等播放器

  现在互联网上有很多网页,特别是含有视频、音乐等页面,需要已经安装了Adobe的flash player为最新版本,才可正常访问;部分视频需要安装qvod播放器等才能播放,举例说明:

  ü 需要安装flash player的:http://www.chevrolet.com.cn/brandsite/

  ü 需要安装Qvod的:http://www.kxkdy.com/tid-8831/

  ü 需要安装百度影音的:http://www.qire123.com/mainland/anxian/

  1.4 迅雷、QQ旋风、快车(flashget)等下载软件

  有些评估需要确认下载链接是否有效,而且通常会限定使用特定软件来下载,所以您要安装迅雷、QQ旋风、快车等常用下载软件来验证是否为有效下载。比如:

  需要安装迅雷才能下载的:http://kuai.xunlei.com/d/GVKWITFIEELJ

  2、评估必备基础知识

  2.1 什么是query-url质量评估

  本问说的query-url质量评估,核心是根据query需求,衡量搜索结果(即一个url页面)的好坏。评估的标准是看搜索结果是否能提供用户想找的信息,满足了用户的需求,以及在多大程度上满足了用户的需求。这里面包含两个层次:

  (1)搜索结果是否可以提供用户想找的信息。如果结果正是用户所找,可以满足用户需求,则是好结果;如果结果里没有用户想要的信息,没有用户关心的内容,则是差结果。

  (2)多大程度上满足了用户的需求。在能满足用户需求的前提下,用户获取信息越丰富、全面、权威越好;成本越低越好,成本包括花费的时间、操作的步骤、用户需要的信息是否可以明显的展现出来等。

  2.2 搜索质量评估的目的

  百度的使命是“让人们最便捷地获取信息,找到所求”,目标是最大程度的满足用户需求,不断完善搜索质量,提升用户体验。

  Query-url质量评估是提升搜索质量的一个基础且核心步骤,我们需要通过评估来发现目前的缺陷,从而提高搜索质量。搜索质量评估工作的成果,将影响到包括您在内的数亿百度用户的搜索体验。

  2.3 常用术语解释

  为了便于理解本文档, 对一些常用的名词术语等进行如下说明:

  ü Query

  也可称查询词、关键词、搜索词,指用户输入到搜索框想要查找的字、词、符号等。以后作为Query出现的词,一般都会用“【”、“】”括起来。

  ü Term

  即组成一个query的字、词,如query【新浪微博】,拆开后的“新浪”、“微博”,我们称为Term。

  ü 用户需求/用户需求意图

  简称“需求”,对于用户来说,来到搜索引擎是带着目的来的,他们键入搜索词是希望获得相应的满足,比如获得相应的信息、网上购物等,我们把用户query背后的这种诉求称为用户需求。

  如搜索【新浪微博】,用户需求是找站点http://t.sina.com.cn/,进入微博查看信息、发微博等;搜【如何减肥】,是想减肥,找减肥的方法产品活动等。我们把用户输入的“query”背后表达的意图称为“用户需求”。

  ü 搜索结果

  指搜索引擎(如百度、google等)根据Query返回的搜索结果,可以指具体某一条Url页面,也可以指所有的搜索结果。

  ü URL

  也称为网页地址,简称网址。百度主页页面的url是“http://www.baidu.com/”。本文用url指就是我们需要评估的一个页面,但是需要注意,我们要评估的是这个url页面载入后这个页面上所提供的内容,而不是url本身。所以query-url评估打分,即根据query,对该url页面的打分。

  ü 网站主页

  我们也将网站的主页面称为网站首页,这是我们登入、浏览该网站时最先看到的主要页面。网站主页的url往往以.com\.edu\.org\.gov等结尾,如http://www.apple.com/就是苹果电脑公司的网站主页,新浪网站的主页为http://www.sina.com.cn/,又例如http://www.mcdonalds.com/是麦当劳的网站主页。

  ü 网站子页面

  网站中凡是非主页的页面,我们都称之为该网站的子页面。比如说http://www.apple.com/iphone/ 就是苹果公司网站的一个子页面,又例如麦当劳的一个子页面为: http://www.mcdonalds.com/usa/rest_locator.html。

  ü 主题

  也称为query表意,一个query的主题即query表达的意思是什么,用户输入一个query是想在搜索引擎中找到与该query主题相关的网页等内容。

  ü 页面内容

  在页面上,广告、赞助商链接等不作为页面内容来进行评估,我们需要评估的是页面的主体信息,如站长发布的内容,即网页自身上所能提供的信息,评分时不应该根据广告来进行评估,即使某些广告可能看上去是相关的。

  ü 需求满足度

  也称需求满足、满足程度,即一个url页面对用户需求满足有多大帮助和价值的衡量,满足程度高的页面对用户非常有帮助,反之满足程度低的页面对用户价值很低。需求满足是衡量搜索引擎质量的最重要因素,是在评估打分中需要重点考虑的。

  ü 有效性

  在评估网页时,资源有效性是非常重要的评估要素,如视频是否能播放、软件是否能下载。一个资源有效高质量网页才能满足用户的需求,一个实际失效的网页,对于用户来说是没用的。

  Part2 query-url质量评估概述

  1、Query-Url质量评估介绍

  Query-URL质量打分是最重要的一种打分方式,是评价各搜索引擎好坏的基本方式之一。这种评估是根据Query背后的需求,去评价某条结果(即URL页面)对用户需求的满足程度。

  2、Query-Url质量评估考虑的维度

  Query-Url质量评估,即评价结果的需求满足,看结果能给用户带来多少的帮助和价值。影响用户需求满足的因素很多,我们列出常见的七种。

  2.1 相关性:query与结果说的是不是一回事

  相关性,是指结果主题跟用户需求的主题匹配程度,两者说的是不是一回事,有没有跑题。相关,是一个好结果最基本的要求。后面其它的因素都建立在其之上。如果不相关,那肯定是差的结果。

  下面列举几种典型的不相关的情况:

  (1)丢了Query中的重要成分。搜【阈怎么发音】,“阈”没了。

  (2)拆散了Query,意思完全偏离。查【林字有多少笔画】,出来“爨字共有多少笔”。虽然query中的term在页面都有命中,但是因为拆散后主题完全偏离。

  (3)含意转变(转义)。搜【李文】,出来“李文和”。

  2.2 需求强度:抓住主要需求

  搜同一个Query,不同用户的需求可能不同。此时,要站在多数用户的角度来判断,越多人查找的需求越重要。主要需求是最多人找的,满足主要需求的结果,是最好的结果;满足冷门需求,则结果差些。

  如【苹果】,主要需求是苹果品牌、产品相关,而水果、电影的主题表意需求较少。

  2.3 丰富程度:详细全面

  多数的查询,越详细的资料内容越好,例如文档、材料、介绍、评论、相关内容等泛需求、又或者一些本身有多种方法需求的query,举几个简单例子:

  ü 搜【感动的作文】,通常用户会参考多篇作文,这时提供多篇结果比一篇好;

  ü 找某个新闻事件,专题要比单篇好;

  ü 搜索某部电视剧,如【一起又看流星雨】,全集通常比某一集好;

  ü 搜索【电脑无法开机】,由于原因可能有多种,分析地越详尽越好。

  ※ 但是要注意,但也有一些case,由于所求内容相对简单单一,可能一两句话就能满足的很好,这种情况不应当认为文字很少丰富度低,而做出降档打分。

  Query需求URL与打分说明

  横看成岭侧成峰的下一句信息需求。找这个诗句的下一句是什么http://zhidao.baidu.com/question/309201850.html;

  3分,完全满足了用户需求这个query需求很明确,不需要有非常丰富的要求,只要能满足用户需求就是较好的结果

  2.4 有效性:能否真正满足

  用户需求的满足是完整的过程。一定要注意用户搜索的最终需求是什么,这个结果能不能满足最终的需求,只有能满足最终需求的结果才是好结果。

  (1)需要检查资源是否有效,如

  ü 搜软件下载,不能看到页面上出现“下载”这几个字就到此为止。用户需求是下载安装使用该软件,要准确地评估,必须尝试下载,看其是否真实可用;若是冒牌伪装,或者有病毒木马,那么就不是好的结果。

  ü 搜【小学数学教学论文】,出来列表页,都是小学数字方面的论文,看起来很好,但是请再点击一两篇论文,看看其是否相关,能否查看阅读。

  (2)查看资源是否权限限制,如

  ü 找某文档,要注册、或花钱才能下载;

  ü 想看电影,要装插件。

  多数用户都希望直接、免费、快速地得到;装软件、注册、花钱,大大增加了用户的成本,不能算高质量。

  2.5 时效性:新

  有些查询,对时间有着较高的要求,期望得到最新的信息,常见的是突发新闻的搜索。哪怕没有明确指定什么新闻,给出最新的内容也是很好的。

  如【上海大火】,自20101115后相当长一段时间,都是找20101115发生的胶州路大火;20120227前后几天搜索【奥斯卡】,主要需求是找84届奥斯卡金像奖。

  招聘、交易等信息对时效性要求高,内容的生成时间极其重要。如果过期了,是陈旧的信息,那对用户通常没太大价值;找某方面的招聘信息,若招聘已结束,价值也很低。几个月前的物品交易信息,很可能交易已完成,现在找到没太大价值;找【电脑组装配置单】,两年前的配置单,给用户的帮助很小。【U盘价格】,一年前的价格对现在参考价值也不是很大。

  2.6 便捷性:找到目标信息要花多少时间和成本

  便捷性,指从打开页面开始,到寻找到所需信息、达到最终目的,所要花费的时间和成本。如果页面有十来屏,所需信息不在第一屏,很多人可能会放弃。如果页面凌乱,或广告晃眼,或广告很多,同样影响用户。

  好的结果应当让用户很方便的找到自己要的信息,比如在第一屏显著位置给出目标信息,用户可以轻易地看到。

  2.7 权威度:英雄也要问出处

  权威性考察的是内容发布在不同网站、或内容贡献者的身份给用户的不同感觉。如:

  ü 同样的软件,都能下载,用户更倾向点击官网,以及自己熟知的的华军、天空等知名软件下载站上的结果;

  ü 同样一篇新闻,出现在新浪新闻、新华网上,跟bbs、个人博客上的转载相比,前者会更权威;

  ü 医治健康、法律相关问题,医生、律师的回答,肯定更让人们信服;

  ü 官方网站发布的信息,比其它网站更可信。

  2.8 总结:不同维度适用query范围

  这7个维度在不同特征的query下,关注的重点有不一样,不同维度适用的query范围说明如下:

  维度适用哪些query举例说明

  相关性所有不相关,如丢掉了核心词肯定是0;

  相关,也有可能是0,如软件虚假,视频不能播放。

  需求比例需求有多个需求分析时,重要的是分析主要需求是什么;

  非主要需求,最高只能2分。

  丰富程度需要详细的内容搜作文范文、报告总结、人物资料等,丰富度越高越好,如【实习总结】、【杨幂资料】

  如一句话、数字等简短的内容即可满足,则丰富程度要求不高,如【刘备字什么】、【横看成岭侧成峰的下一句】

  有效性大多为交互操作类query,如下载、视频、试听、文档阅读等,只有资源有效才能满足用户需求的下载,一定要尝试能否下载,是否真实

  如视频,要看内容是否查看,是否真实

  如物流查询,要真能查,才有价值。

  时效性明确或隐含着时间要求的查询近期事件(如地震)、招聘、交易信息等,对时效性要求高;

  高考等周期性事件也有时效性要求;

  中国人口等隐含最新数据的时效性要求;

  便捷性所有用户要找的位于显著位置,第一眼就能看到为便捷性好;当比较难以在页面方便的找到时,即为获取信息满足成本高,会稍差;

  权威度软件下载、商品交易、医疗健康等对权威有要求来自知名网站、专业网站,让人放心。软件下载、医疗健康、银行等,对权威方面的要求高;

  3、Query-Url打分分档介绍

  打分类别含义描述

  4(Vital)官方官网权威页面(详细说明见Part4的2)

  3(Useful)很好,对大多数人都非常有用该url页面能满足大多数用户需求,很有价值

  2(Relevant)比较有价值,对部分人较有帮助该url页面对较多或一些用户较有价值

  1(Slightly Relevant)稍沾边,略微有帮助该url页面对大多数用户价值不高,但是跟query相关,少数用户觉得该页面有点帮助

  0(Off-topic OR Useless)不相关或无用资源该url页面毫无价值或价值很低

  死链 需求无法判断或无法被评估的页面(详细说明见Part4的7)

  4、Query-Url打分原则

  作为评估人员,需要将自己当成实际输入这个query的用户,去评判各个结果能否满足自己的需求,从而判断各个结果的好坏,并给出适当的评分。

  站在“用户”的角度,评测人员把自己当成真正的用户,这一点非常重要。

  5、Query-Url评估步骤

  整个评估过程可划分为三个步骤:

  ü 需求判断:分析推断用户搜索这个query是想找什么,确定用户需求;

  ü 页面质量判断:查看实际url页面,判断结果能否以及多大程度上满足用户需求;

  ü 打分:根据本评估指南,选择合适的分值。

  Part3 理解用户需求

  用户为满足自己某种需求而来到搜索引擎的,判断用户的需求是准确评估打分的必备基础。只有准确地判断出用户需求,了解用户搜索的目的,才能合理地衡量结果的质量好坏。

  1、如何判断query需求

  多数Query,本身表述清楚,含义明确,以其表达出来的意思为准。如【让子弹飞 剧情】、【繁体在线转换】、【舞蹈教学视频】等。

  有些Query依靠个人的知识、经验能够理解,但还有一些可能需要通过查询相应的百科(如http://baike.baidu.com )、用不同的搜索引擎进行搜索,通过其检索结果学习了解背景知识后,从而判断出搜索的目的。

  如【bl怎么去诺森德】,如果你不玩魔兽世界,单看Query,很难弄明白其搜索意图。通过查看几个搜索结果后,知道用户是找“魔兽世界部落的玩家怎么去诺森德”。因此,建议遇到不了解的Query,先拿Query到百度、Google等搜索引擎上搜索了解一下。

  ※ 注意:当通过搜索引擎来确认用户需求时,千万不要直接将排在前面的结果当做好结果,将排在后面的结果当做差结果。这应当只作为你确认用户需求的方式之一,而非直接根据搜索引擎现有排序情况进行打分。

  另外,当query需求多样时,我们比较难判断用户的主要需求有哪些方面,我们可以借助百度搜索建议提示,了解用户的主要需求。如:【天龙八部】有多个含义,游戏、小说、电视剧、佛教本义等,那到底哪个是主需求呢。看如下搜索建议提示,多是游戏相关,前两个“天龙八部3”、“天龙八部3官网”,其中多数是关于网游的,那么可以推断搜【天龙八部】的主要需求是找网络游戏。

  【天龙八部】的搜索框提示:

  2、query背后的实际需求意图

  在理解query本身的含义后,接着你应当考虑用户输入这个query时,他所需要得到实际满足的需求是什么,并以此来对所给的url做出打分。

  例如【俄罗斯方块】,用户需求很可能是要在线玩这个游戏,也有可能是要下载它;【还珠格格第一部】,大多数输入这个query知道这是一部电视剧,需求意图是想看这个电视剧。下面是一些用户需求意图的例子:

  Query用户需求意图

  圆通快递查询快递单号,查找附近的网点等

  京东访问京东官网

  万年历在线查询万年历,或下载万年历软件

  猴头菇了解相应的介绍、做法等

  3、query主体表意是否确定与需求是否多样

  除了需求非常明确的query,如【让子弹飞 剧情】、【横看成岭侧成峰的下一句】,不少query都存在多样的需求。针对query需求的多样,我们会从下面3个角度理解:

  ü Query主体表意:

  存在query主体表意是确定还是非确定的区分,如许多query表意多样,即同样的query,表达的意思却差别万分。如:

  【苹果】,有苹果品牌(ipad、iPhone对应的品牌);有苹果这种水果;还有电影《苹果》,这些都可能是用户要找的东西;【土豆】,用户的需求可能指视频站点或者食物等。

  ü Query需求维度:

  存在需求维度单一还是多样的区分,如【QQ下载】需求维度单一,即软件下载的需求;而【步步惊心电视剧】存在多种需求维度,包括电视剧观看、电视剧剧情等;

  ü Query需求强度:

  即针对query不同主体表意和需求维度,存在需求强度大小之分,分为主要需求、泛需求、小众/冷门需求三类,后面详细介绍。

  根据需求主题表意和维度,主要可以分为下面三种情况:

  ü query主体确定,需求维度单一,如【美图秀秀在线下载】;

  ü query主体确定,需求多样,如【赵薇】;

  ü query主体表意不确定,需求多样,如【苹果】。

  4、query需求的主次之分

  百度的用户数以亿计,搜索同一个Query,不同人可能有着不同的需求,搜索引擎无法同样程度满足所有人的需求,而是尽可能最大程度满足大多数用户的需求。这也要求我们评估时要尽量挣脱个人局限,站在大多数用户的角度来衡量,把握需求主次之分。

  根据query不同表意下的需求强度,以及同样表意下不同需求维度的需求强度,需求强弱可能有以下几种情况:

  4.1 主需求

  即输入这个query的用户中,大多数用户心目中存在的需求。

  (1)多义query的表意主次之分:

  如【windows】,当大多数用户键入这个query时,需求是微软的操作系统,而不是在墙上的玻璃窗户。在搜索引擎简单进行检索后,一般可以了解用户的主需求是什么。

  (2)同义query下不同需求维度主次之分:除了利用搜索引擎、搜索引擎搜索提示等工具了解外,一般比较依赖你自身的常识判断,如:

  ü 对于软件来说,主需求往往是下载;

  ü 对于视频来说,主需求往往是在线观看;

  ü 对于小说来说,主需求往往是在线阅读;

  4.2 重要需求/次要需求

  即输入这个query的用户中,有部分用户存在的需求,根据需求的强度的略微差别,存在重要和次要之分。如2012年1月搜【城市猎人】,电影的需求即为次要需求;【亚马逊】,南美洲亚马逊河流的需求;

  4.3 小众/冷门需求

  在某些query下,有的表意和需求维度比较冷僻,用户需求的比例比较低或非常低,并且根据强度上略微差异,称为小众或冷门需求。如【城市猎人】,绝大部分人都是找影视结果,很少有人的需求是一个blogid为“城市猎人”的博客。该博客在这个query下,就称之为冷门需求,认为用户在这个query下想找这个结果的需求很低。

  在某url满足的是query的小众/冷门需求时,往往评分比较低。

  4.4 特殊情况:泛需求

  在某些query下,几乎没有占绝对主导地位的表意或同义表意需求维度上绝对强弱之分,都有一定比例的用户需求,这样情况下根据需求强弱的差别打分,如【长沙】、【书籍】,以【倾国倾城】为例说明:

  ü 找“倾国倾城”的意思,如http://zhidao.baidu.com/question/298263788.html;

  ü “倾国倾城”的音乐,如http://www.yue365.com/play/3790/187195.shtml;

  ü “倾国倾城”的小说,如http://www.readnovel.com/book/56214/;

  这些释义中,并没有哪一个是绝对主需求,认为query的需求很泛,其中音乐和意思的需求略强于小说等其他需求,不同的用户想得到不同表意相关的解释。

  ※ 注意:该类query因为没有绝对主需求,所以没有4分结果;

  5、query需求意图类型

  根据用户输入query时的需求意图不同,我们将用户需求大致分为3类:寻址需求、信息需求、交互操作需求。需要注意的是,有很多的query都会有多种需求,而每种需求可能是不同意图类型,所以需求意图都用来表达某个query下的某种需求是什么类型的。

  Query某种需求的类型分为交互操作类、信息类、寻址类这3种,可以用“Do-Know-Go”这个来简单表示,这种分类方法有助于判断一个页面该怎么打分,具体介绍如下:

  5.1 寻址需求

  定义:寻址需求就是指,用户输入这个query,就是为了去某个特殊的页面,而且是用户已有确认的某个页面、或某个网站。用户希望通过搜索某query,来访问该页面。因此,在寻址需求中,最能满足用户需求的页面就是用户所求的那个url。

  典型范例:

  Query用户需求意图

  ibmhttp://www.ibm.com/cn/zh/

  youkuhttp://www.youku.com/

  京东http://www.360buy.com/

  北京大学http://www.pku.edu.cn/

  人人网登陆http://www.renren.com/

  5.2 信息需求

  定义:用户的需求是获取信息,想了解某信息、某知识,搜索引擎的目标是让用户找到所求信息,给出相关的优质、权威、全面的信息。

  典型范例:

  Query用户需求意图

  西夏王陵信息介绍,关于该景点和旅游

  DHC g10拆机方法如何拆机,拆机的步骤

  如何清除油渍找清除油渍的方法

  5.3 交互操作需求

  定义:用户是要从事某项操作和活动,往往是需要在某个url上,与页面进行一定的交互,从而达到用户的目标、完成相应的操作。一般对资源是否有效从而完成操作有较高要求。

  典型交互需求:

  •购买产品\•下载免费或需购买的软件\•网上支付帐单\•在线玩游戏\•预订酒店\•听音乐\•观看视频\•查看图片\•网上调查

  典型具有交互需求类别需求的query:

  Query用户可能的需求意图

  甲壳虫乐队海报查看或下载对应图片

  Adobe Reader下载软件下载

  在线职业测试在线做职业测试

  汇率兑换在线进行汇率兑换查询

  龙门飞甲 DVD在线购买或下载DVD

  小游戏在线玩儿小游戏

  英文翻译在线进行中英之间翻译

  Part4 五档打分标准

  1、各档打分定义

  Query-url相关性打分提供了6种打分选项,包括0-4打分和抛弃。基于用户需求意图分析和Url页面对用户需求满足程度,进行4、3、2、1、0的打分。而对于特殊情况无法进行打分的页面,进行“抛弃”的标记。具体说明如下:

  打分类别含义描述

  4(Vital)官方官网权威页面

  3(Useful)很好:非常有价值该url页面能满足大多数用户需求,很有价值

  2(Relevant)不错:较有价值该url页面对较多或一些用户较有价值

  1(Slightly Relevant)略相关、有点帮助该url页面对大多数用户价值不高,但是跟query相关,少数用户觉得该页面有点帮助

  0(Off-topic OR Useless)跟query主题完全不相关或无用资源该url页面毫无价值或价值很低

  死链即页面死链导致无法判断死链导致无法被评估的页面

  2、4分——官方

  2.1 4分的定义

  4分仅适合于某些特殊情况,对query和url页面都存在着特殊的要求:

  (1)适用query:主需求明确

  对query的基本要求是:主需求很明确,主要语义表意意图的网站页面才打4分,否则都不能打4分。如query【当当】,存在主要表意需求“著名电子商务网站”,所以http://www.dangdang.com/可以打4分,而如果是某个“当当”的制鞋公司则不能给4分。

  (2)适用url:官方页面

  ü 官方:Url是Query对应主要需求的官方网站、或官网上对应的页面,如人名、地名、机构、产品、公司等的官网等;

  ü 首发:用户想找报道、小说、论坛上的帖子等文字作品,结果是作者博客上的原文、该作品的首发地址,这种也可以认为是官方的页面;

  (3)特殊说明:4分不一定都是最有价值

  4分的定义中,我们并没有对结果的质量好坏提出非常明确的要求。当然,4分的结果往往都是非常有帮助的、排版良好的,但是这并非是绝对条件。对于某些query,官方结果可能并非互联网上最有帮助的页面,但由于其官方、原创性,标记4分是合理的。

  2.2 举例说明

  下面将针对一些特定类型进行举例说明什么情景下打4分,什么情景下不能打4分:

  2.2.1 4分典型例子

  (1)寻址类query

  下面是一些用户找某个具体网站的query的例子:

  Query用户需求意图4分URLUrl说明

  qq空间去qq空间官方页面http://qzone.qq.com/ QQ空间的网址

  4399小游戏去4399游戏网站玩游戏http://www.4399.com/ 4399官方网站

  优酷去优酷视频的官网看视频http://www.youku.com/ 优酷官网

  新浪微博去新浪微博的官网查看、发布微博等http://weibo.com/新浪微博的官方页面

  (2)实体类query

  对于实体类query,如人名、机构、公司、电影、事件等。有些是寻址类需求,有些可能是找相关信息的,这些实体query的官网都认为是官方权威的结果,可以打4分。

  Query类型Query4分URLUrl说明

  名人姚晨http://t.sina.com.cn/yaochen 姚晨本人官方的微博

  公司Lenovohttp://www.lenovo.com.cn/ Lenovo(联想)中文官方网站

  大学北京大学http://www.pku.edu.cn/ 北京大学的官方网站

  政府机构铁道部http://www.china-mor.gov.cn/ 铁道部官方网站

  银行招商银行http://www.cmbchina.com/ 招商银行的官网

  事件上海世博会http://www.expo2010.cn/2010年上海世博会的官网

  产品Iphonehttp://www.apple.com.cn/iphone/#Iphone产品的官方页面

  景点故宫http://www.dpm.org.cn/index16801050.html 故宫的官方网站

  (3)指定网站/网页query

  用户的需求是某个网站内的子站或子页面,那么对应的站点能很好满足需求的页面可以给4分。

  Query用户需求意图4分URLUrl说明

  佳能ixus210产品信息、购买需求 http://www.canon.com.cn/products/camera/ixus/210/佳能官网上的ixus210介绍

  4399赛尔号4399网站上的该游戏http://www.4399.com/flash/seer.htm 4399上的赛尔号

  交行信用卡中心交行官网上的信用卡频道http://creditcard.bankcomm.com/ 官网上对应的页面

  美人心计 奇艺奇艺网站上的对应影片http://www.qiyi.com/dianshiju/mrxj.html视频网站奇艺上的《美人心计》电视剧,是用户明确指定网站的完全满足需求结果,可以给4分。

  (4)人名query

  所有的4分结果,都要求query主需求明确。对于人名query这一类相对特殊的query来说,根据query本身的特征做出一些分类,从而帮助判断是否可以有4分结果。如下:

  Query类别Query范例是否有4分结果

  著名人名周杰伦、奥巴马、布兰妮可以;有绝对主需求

  非名人但人名特指Lalith Wickramanayaka可以;能判断出明确指代某个人,是斯里兰卡的某个大学老师

  不著名常见人名安娜、小王、王丽娜、王超不可;认为需求分散无主需求

  常见人名+限定王超 爱乐团可以;如果范围被缩小,能对应到唯一的某人上,可以有4分

  在有4分结果的人名query下,有些典型的范例:她(他)的官方网站、博客、微博、空间、社交网站(如人人、开心)上的个人主页等,如果确实是本人发布,或者已得到授权,那么可以给4分。

  ※ 注意:非人名的实体query,例如是品牌、公司所具有的和维护的博客、微博等社交类网站,即使确实是官方的,那么也认为不可以达到4分标准;

  范例:

  QueryURL页面Url说明

  姚晨http://t.sina.com.cn/yaochen

  http://blog.sina.com.cn/yaochen姚晨的微博和博客;4分

  华章图书http://t.sina.com.cn/huazhangbook

  http://site.douban.com/hzbooks/ 它的新浪微博、豆瓣小站;不可以4分

  (5)Url 查询query

  有些query直接就是某个具体的url,或者看起来和url非常相似,称之为url查询;

  典型url查询:

  ü Query本身就是一个完整的url,范例:www.youku.com

  ü 只要添加www这样的常见前缀即可成为完整url:360buy.com(可能访问时会自动加上前缀)

  ü 有些虽然没有前缀,但确实也是完整url的:xunlei.com

  对于query查询来说,主需求就是这个地址本身:

  Query用户需求意图4分URLUrl说明

  Youku.com对应页面http://youku.com/即对应url

  www.360buy.com对应页面http://www.360buy.com/即对应url

  http://www.jjwxc.net/onebook.php?novelid=19520对应页面http://www.jjwxc.net/onebook.php?novelid=19520即对应url

  Renren.com对应页面http://renren.com/

  http://www.renren.com/即对应url

  (6)首发地址Url

  Query是文章、小说名等,作者原创首发帖子、博客、空间、文章等可以给4分。如果文章是报刊发表的,则该报刊网站上的对应文章可以给4分。

  Query用户需求意图4分URLUrl说明

  象一滴水一样 ——纪念高华老师找这篇文章http://www.drunkpiano-liuyu.net/?p=826作者刘瑜博客上的原文。

  官居一品阅读浏览需求http://www.qidian.com/Book/1343635.aspx 首发站:起点,该书主页

  ※ 注意:有时候比较难以判定这个官网、博客、社交网站等是否是官方的,可以搜索看一下大家评论是否是官网;原创有些情况下比较难判断,如果你仔细分析后还是不能确定是否原创、首发,请不要打4分,而按照实际需求满足情况给予合适的打分。

  2.2.2 没有4分的典型情况

  4分结果为要求相当高的好结果,并非所有的query都有。可以认为大多数query没有4分的网页。以下几种情况是不会有4分页面的:

  ü query没有主需求,需求比较分散;

  ü Query并非一个实体、或者并非寻址需求、以及非原创地址、非url查询对应的url;

  ü Query并没有对应的官方网站或网页存在;

  ü Query需求很泛,没有任何人或实体可以对应并完全覆盖这个query,如蘑菇

  无4分结果的query范例:

  Query说明

  北大建校多少年无4分页面,北大是实体名,但是整个query并非实体名

  iPhone评论无4分页面,iphone是实体名,但是整个query不是,找相关信息

  DDD无4分页面,可对应到多个不同实体的缩写上,无主需求

  王超英勇事迹无4分页面,是信息需求,不存在官网

  谈南路小学无4分页面,该学校无官方网站

  心脏病无4分页面,query需求较泛,无对应的官方页面

  北京旅游无4分页面,用户不是明确地要寻找某条url

  2.2.3 有多个4分结果的典型情况

  虽然4分的要求是原创、官方,但有时候确实有些query下不但具有4分结果,而且可能具有多个4分结果,打分可以一致的典型类别:

  ü 多个url对应的实际页面完全相同,例如有无www前缀,index后缀等区别;

  ü 多个url具有相互跳转关系,例如urlA会自动跳转到urlB;

  ü 多个url对于query来说都可以快捷满足用户需求,典型的例如:

  l 下载需求:软件官网首页与下载内页;

  l 网站/产品:某网站与其提供的特殊产品都有较大需求(注意:此非无主需求)。

  (1)URL不一样,实际页面完全相同

  Query4分URLUrl说明

  优酷A:http://www.youku.com/

  B:http://www.youku.com/index/ 不同的url,但都是优酷,AB之间无直接跳转

  国航A:http://www.airchina.com.cn/

  B:http://www.airchina.com.cn/? cid=bptopt0301不同的url,但都是国航,AB之间无直接跳转

  (2)URL之间跳转关系,实际页面一样

  Query4分URLUrl说明

  新浪微博A:http://t.sina.com.cn/

  B:http://weibo.com/新浪微博的官方页面,A总是会跳转到B

  nbaA:http://www.nba.com/

  B:http://china.nba.com/ A根据访问所在地(中国)跳转到B(中文网站),由于百度用户主要在国内,所以两条结果都给4分。

  华章图书A:http://www.hzbook.com/

  B:http://www.hzbook.com/ps/它的官方网站,A总是会跳转到B

  交行信用卡中心A:http://creditcard.bankcomm.com/

  B:http://creditcard.bankcomm.com/bcms/index.htm 官网上对应的页面,A总是会跳转到B

  (3)不同URL都可以快捷满足主要需求

  Query4分URLUrl说明

  163http://www.163.com/

  http://mail.163.com/ 163官网主页必定可以是4分,邮箱是【163】这个query绝对主要需求,也可以给4分

  PPTVhttp://www.pptv.com/

  http://download.pptv.com/ 网站名,也是软件,主要需求是下载软件。主页和下载页都给4分。

  酷狗音乐下载http://download.kugou.com/

  http://www.kugou.com/ 主页上可轻易下载,也给4分。

  北京旅游局http://www.visitbeijing.com.cn/

  http://www.bjta.gov.cn/ 北京旅游局的官方网站及其办的政务网

  斗破苍穹http://www.qidian.com/Book/1209977.aspx

  http://www.qidian.com/BookReader/1209977.aspx 原创,起点中文网的“天蚕土豆”写的这部小说。

  小木虫http://emuch.net/

  http://emuch.net/bbs/ 该网站主体是论坛,所以网站首页和论坛都给4分。

  2.2.4 其他考量

  (1)语言问题

  国际上一些大的机构、品牌,往往有多种语言的官网页面,对于这种情况,考虑到百度的用户都主要是中文用户,所以有语言障碍的页面应当酌情降分,典型原则:

  ü 具有简体中文官网:只有简体中文官网可以给4分,英文及其他语言给3分;

  ü 没有简体中文官网:英文\繁体中文官网可以给4分,该机构品牌所在地语言的官网为3分,如The face shop是韩国的品牌,那么韩语官网可以给3分,其他较冷门语言给2分。

  (2)URL-站内分站自动跳转

  国内有一些网站,会根据访问者的IP自动跳转到访问者所在地的分站。在北京点击58同城网http://www.58.com/,会跳到http://bj.58.com/。但评估时,还是应该以所给的url自身为评估对象。举例说明如下:

  QueryURLUrl说明

  58同城http://www.58.com/即使会自动跳转到当地分站,其他地点用户也可以满足,该结果仍然可以给4分

  58同城http://bj.58.com/

  http://jn.58.com/ 该结果分别为北京、济南当地分站,但该结果无法直接满足其他地点用户的需求,3分

  (3)URL地址的影响

  有些4分结果中,query与url具有包含关系、url中包含query,例如Q=youku,www.youku.com就是对应官网, 4分结果中有一些就是url中包含query本身的。

  但是需要注意的是,反之并不一定成立,有些query下即使url中包含query,也不一定就是4分结果。如【CS】,主需求是找游戏反恐精英,简称CS的游戏,即使有一个网站域名为http://www.cs.com.cn/,那么也不是4分结果,所以还是需要根据用户的需求以及页面满足情况来仔细判断。

  3、3分——很好,对大多数人都非常有用

  3.1 3分的定义

  3分结果,认为应当是在该query下,对于大多数用户都非常有用的好结果。非常有用的3分结果一般应该具备的特征为:符合query需求、页面质量很高。

  这些页面往往具有以下全部或者部分的典型特征:需求满足程度高、权威度高、页面资源真实可用(如可以播放、收听)、页面看起来整洁组织排版很好、页面有用信息容易找到,在时效性需求的query下(如突然爆发的新闻事件)时效性也很好。

  注意:一个query,不止一个url页面可以打3分。

  3.2 举例说明

  3分常见例子:

  ü 搜网站名称,该网站下的热门频道或栏目;

  ü 搜电视剧,优酷、土豆、奇艺等网站上的专辑;

  ü 找免费软件,华军、天空、多特等网站的下载页;

  ü 搜范文例文,内容丰富的列表页;

  ü 搜商品,包含详细的介绍、价格、可信任可购买的商铺;

  ü 找明星,他/她的详细资料、专题、fans为其创建的高质量网站;

  ü 找文章、小说,有全部内容的结果。

  (1)信息需求

  Query用户需求意图3分URLUrl说明

  如何解散QQ群信息需求,想知道解散方法http://zhidao.baidu.com/question/380620977.html最佳答案直接提供有效方法

  CSCO 股票信息需求,想知道该公司的股市行情http://www.imeigu.com/CSCO权威网站上提供的股票信息,页面优质可信

  脑梗塞症状信息需求,想知道该疾病症状是什么http://jbk.39.net/keshi/waike/naowaike/sign/48dc6.html权威网站上的内容丰富的页面

  2002年的第一场雪 歌词信息需求,想知道该歌曲歌词是什么http://baike.baidu.com/view/447573.htm?#4权威结果,歌词直接显示出来

  第28届中国电影金鸡奖 获奖名单信息需求,想知道具体的获奖人名单http://yule.sohu.com/20111021/n322995564.shtml权威网站上列出的名单

  刘家窑 九头鸟信息需求,想知道这个店的评价、地址等信息http://www.dianping.com/shop/4097309该餐馆的大众点评页面,提供了电话、评论等各方面信息,对大多数用户都非常有用

  5的平方根信息需求,想知道5的平方根是多少http://zhidao.baidu.com/question/316044297.html

  http://zhidao.baidu.com/question/328047365.html虽然页面丰富上略有差异,但实际均提供了准确答案,都可以到3分。

  草长莺飞二月天的下一句信息需求,想知道该原文的下一句是什么http://zhidao.baidu.com/question/29877078

  http://wenwen.soso.com/z/q40927846.htm

  http://ks.cn.yahoo.com/question/1590002322140.html

  http://zhidao.baidu.com/question/76842542.html答案直接给出,回答正确

  (2)交互操作需求

  Query用户需求意图3分URLUrl说明

  西城男孩告别巡演 广州站 订票交互需求,想购买该演唱会的门票http://piao.youa.com/loader?url=http%3A%2F%2Fpiao.youa.baidu.com%2Fshow%2F0%2Fticket%3Ftid%3Deeeeb7521010eb13bddec7e7有啊票务预订页面,比较权威、可信,用户需求能够得到较好满足

  QQ下载交互需求,下载为主需求http://xiazai.zol.com.cn/detail/38/371537.shtml

  http://www.onlinedown.net/soft/20355.htm Zol,华军是著名的软件下载站点,且软件能够下载,对大多数用户都非常有用

  酷狗音乐下载下载主需求http://www.skycn.com/soft/14786.html

  http://www.onlinedown.net/soft/23764.htm

  http://dl.pconline.com.cn/html_2/1/88/id=42960&pn=0.html

  http://xiazai.zol.com.cn/detail/10/98401.shtml这些都是知名权威的站点,下载链接多,保证无毒

  未央沉浮下载交互需求,想下载对应的内容http://t.book118.com/html/txt185361.shtm

  http://www.4020.cn/Txt/XiaoShuo-28474.html 均无权限的完整可下载页面,可以符合用户需求

  违章交互需求,想查询车辆违章信息http://auto.sohu.com/s2004/weizhangchaxun.shtml

  http://www.ip138.com/weizhang.htm 聚合页面,多个地方的违章结果查询链接,验证能够真正的查询

  宫锁心玉视频主需求http://www.iqiyi.com/dianshiju/gsxy.html

  http://tv.sohu.com/s2011/gsxy/

  http://www.letv.com/ptv/pplay/36877.html

  http://www.tudou.com/playlist/album/id65393.html包含全部剧集,视频清晰,顺序排列

  (3)寻址需求

  Query用户需求意图3分URLUrl说明

  优酷找优酷视频网站http://movie.youku.com/

  http://tv.youku.com/ 优酷下的热门频道

  当当主要找当当电子商务网站http://book.dangdang.com/当当下的图书频道

  另外,对于用户来说,当他们搜索明星、视频名称、电视节目等时,本身经常出于娱乐八卦目的,希望能找到一些娱乐类结果,所以如下一些资源质量很高的满足娱乐需求的结果,也可以到3分,比如:

  Query用户需求意图3分URLUrl说明

  舞蹈视频观看舞蹈视频http://www.youku.com/v_showlist/t2c95g2098.html多个舞蹈视频,丰富、无权限

  郭德纲郭德纲,相声需求比较大,比较能够娱乐用户http://hi.video.sina.com.cn/you/guodegang/kuliebiao.php?dpc=1多个相声列表

  张学友找张学友相关信息http://video.baidu.com/v?ct=301989888&rn=20&pn=0&db=0&s=8&word=%D5%C5%D1%A7%D3%D1&fr=ala0这是一个非常好的视频专题页面,能够提供张学友各方面的视频信息

  刘德华明星人名,搜索这类query的用户八卦需求比较强http://gb.cri.cn/27564/2012/02/29/1042s3578419.htm娱乐圈人物,近期新闻、娱乐页面等也可以给到3分(在2012年2月底搜该query)

  4、2分——比较有价值,对部分人较有帮助

  4.1 2分的定义

  2分,意味着该页面对于搜索这个query的部分用户是有帮助的。

  也可以理解为,2分结果对于用户来说,在需求满足方面要稍微差于3分结果,比如丰富全面程度、时效性程度、权威程度(来自不太知名站点)等方面略差;或者只能涵盖query用户需求的一部分,如常见的缺乏明确主需求的query,往往最高只能到2分。

  2分的网页虽然比3分差,但对于用户来说也必须是有价值帮助的,即这个结果对于用户来说,与query主题相关,页面质量不垃圾。

  4.2 举例说明

  2分常见例子,比如:

  ü 搜网站名,该网站下普通的频道;

  ü 搜电视剧,剧集多但不全;或者剧集全,但排列无次序,查找不便;或无视频的专题(包括剧情、新闻等);

  ü 找免费软件,可下载,但下载过程不顺畅,干扰大,不是权威站点;

  ü 找范文例文,是具体的某一篇或只有少数一两篇的列表页;

  ü 搜商品名,只是详细的参数介绍,没有其它如评论等信息。

  Query用户需求意图2分URLUrl说明

  韩国 汉城汉城的相关信息,或景点等旅游需求http://www.yododo.com/area/map/1-03-03该页面是汉城的地图,对于部分用户来说是有帮助的

  汤姆·克鲁斯该明星的介绍、影片、视频等http://movie.douban.com/celebrity/1054435/

  http://people.mtime.com/899490/ 该明星的相关介绍,虽然相关但是满足程度不够高,互联网上有更多很优质的页面,这个页面对一些用户有助

  亚伯拉罕·林肯 生日找到特定的信息:一个日期http://zhidao.baidu.com/question/282698922.html此网页包含所有美国总统的生日,找到林肯生日的成本较高

  Wii购买对应硬件、查找试用的游戏、浏览官网等http://www.eachgame.cn/category-14-b0.htmlWii的配件销售;部分用户有帮助

  燕景苑餐厅 评论浏览对应的评论http://www.dianping.com/shop/4565212#!hippo/index=4,shopId=4565212,page=22互联网上很多评论网页都具有很多页,而这个页面仅仅具有1个评论,只对部分用户有帮助

  左眼皮跳跳 歌词查看相应歌词http://www.huole.com/lyric/130332.htm歌曲歌词不完整

  优酷寻址主需求http://music.youku.com/

  http://auto.youku.com/

  http://baike.baidu.com/view/670059.htm

  http://www.soku.com/站内一般的频道、百科介绍

  酷狗音乐下载下载主需求http://www.orsoon.com/Soft/7724.html

  http://www.jz5u.com/Soft/softdown.asp?softid=23277 干扰多,非知名下载站

  长沙长沙这个城市各方面的信息,如旅游、介绍、政府机构等http://www.cshr.com.cn/

  http://changsha.bitauto.com/

  http://www.hncsjj.gov.cn/Defaultother.aspx

  http://changsha.8684.cn/ 当地的人才市场、公交、交警等站点

  姚晨人名需求,包括介绍、新闻、图片等各方面需求http://tieba.baidu.com/f?kw=%D2%A6%B3%BF&贴吧是次要需求

  5个女性字的游戏名字5个字的女性游戏名称http://wenwen.soso.com/z/q275707944.htm?sp=2001穿越火线下多个游戏名,大部分是女性化的

  1024需求比较泛,有网络常用语1024的解释需求http://zhidao.baidu.com/question/83420463.html对1024在网络上的应用,解释的比较清楚

  5、1分——稍沾边,略微有帮助

  5.1 1分的定义

  1分结果可以理解为,页面跟query是相关的,但是对于大多数用户来说这个页面都是没有用的,可能只对少量用户略有价值。同时,有些“表面看起来相关的差结果”,也会是1分,具体见5.3详细说明。

  1分结果具有以下的一些特征:

  ü 页面质量低劣;

  ü 相关但是包含的有用信息很少;

  ü 信息因过时、过于具体、过于笼统等而难以达到2分的要求;

  ü URL页面结果对于query来说只能满足非常冷门的需求;

  ü 页面是wap页面,且因wap页面导致用户获取信息不便,当然,前提是wap页面至少是相关的;如果无关应该给0分。

  5.2 举例说明

  Query用户需求意图1分URLUrl说明

  怀孕症状寻找关于怀孕症状相关的信息http://www.yun5.cn/zhuyishixiang/2011914.html页面质量差,文本编辑度低。内容是关于“怀孕后乳房有什么变化”,对大多数用户都没价值

  无性婚姻该怎么办寻找解决办法http://zhidao.baidu.com/question/285998938.html回答很万金油,适用于各种问题,对于用户来说没什么帮助

  城市猎人找电视剧、电影相关视频、剧情介绍等http://poetry.goodmood.cn/a/2011/0118/0_322799.html无名作者写的一首同名诗歌,需求很冷僻

  百度贴吧寻址需求,找百度贴吧这个网站http://tieba.baidu.com/p/1433598647贴吧的一个具体帖子,过于具体,很难满足用户需求

  万年历查看万年历http://www.9630369.com/wannianli-2001.html日期很陈旧,是2001年的万年历

  脑梗塞症状信息需求,想知道该疾病症状是什么http://www.i0532.net/thread-80527-1-1.html主要提及的是如何治疗,只是简单提及了症状,对于大部分用户来说该结果价值比较低

  王菲了解该人介绍、新闻、图片等http://news.hainan.net/newshtml08/2009w4r2/500161f9.htm09年的新闻,价值很低

  哈尔滨 宾馆寻找哈尔滨的宾馆信息,预定宾馆等 http://www.homeinns.com/index/index.aspx页面是知名连锁酒店的官网,但没有直接提供信息,需要在搜索框中输入后搜索哈尔滨地点,才可以找到哈尔滨的宾馆

  淘宝寻址需求http://m.taobao.com/手机版官网主页,不适合PC机浏览、使用

  清朝前期疆域图寻找指定的地图http://zhidao.baidu.com/question/102564242.html?an=0&si=9只有文字描述,实际没有地图

  youku寻址需求,想去www.youku.comhttp://www.293.net/youku.comip等站点信息,对于大多数用户来说没用

  5.3 表面相关的差结果

  1分的结果中,有一类是表面相关的结果,即标题(Title)看起来相关,但是实际页面质量低质,提供的有价值信息非常少,这些页面的Title中往往会有一些query中的term命中,使得这些结果看起来是比实际情况要更相关些,典型页面:

  ü 有些网页具有很多完全无关的链接与广告,实际有效的内容非常少;

  ü 有些网页内容主要为堆砌query关键字;

  ü 完全复制其他网站内容,即“采集”其他网站资源,且排版很差,影响阅读;

  ü 有些网页具有独特的内容,但是质量非常一般,有价值信息少;

  注意:并不是所有内容为复制而来的页面都认为是低质量页面,最典型的例子:百科、知道

  百科、知道上的很多内容往往是复制而来的,非原创,但是并不认为是低质量页面,因为其内容是经过精心编辑的,对于用户是非常有帮助的。如果页面排版整齐,是确实为了满足用户、解决大家问题而设计,而非仅仅是为了吸引用户去点击广告,那么这个页面就根据实际满足情况而进行打分,而非简单认为是1分的低质结果。

  下面举一些典型范例说明:

  Query用户需求意图1分URLUrl说明

  掌事129

  掌事这部小说的129章http://www.yueduge.com/html/8/8484/2054418.html 不是文字,是比较难以阅读的图片版本,且读起来很困难

  youku主需求是官网http://www.hao123.cn/liuliang/1youku.htm看似是官网,但是从域名可知是嵌套页,并非真正的官网,是一个假的山寨网站,1分

  百度云手机手机介绍、报价等需求http://www.fxqx.com.cn/fa/fa/htopic/62479.html采集页面,广告很多,页面无排版很不方便阅读

  人人网如何申诉信息需求,申诉方法http://zhidao.baidu.com/question/163289402Title很好,但是实际内容低质,很难满足用户需求

  www.up360.com.url查询http://wenwen.soso.com/z/q333406981.htm?sp=4130虽然没有任何介绍,但是url查询本身有查看url在网络上传播的需求,只要完全命中可以给1分

  15923549507手机号码所在地查询http://www.27txt.com/mobile/zhongqing_1592354.html

  1分,整屏很多无用信息,但确实可以满足所在地的需求

  6、0分——不相关或无用资源

  6.1 0分的定义

  0分代表对于用户来说,这个结果对于搜该query的所有用户完全没有帮助的,一般有以下一些特征:

  ü 不相关,即搜A给B,完全不能满足用户需求

  ü 页面无价值,即页面即使相关,但实质是页面完全无法提供有价值信息,如只有链接、广告,而没实际相关内容,这些页面往往作弊较多;

  6.2 举例说明

  Query用户需求意图0分URLUrl说明

  2008年澳大利亚网球公开赛男子单打结果寻找指定年份指定赛事的结果列表http://zh.wikipedia.org/zh-hans/2012%E5%B9%B4%E6%BE%B3%E6%B4%B2%E7%B6%B2%E7%90%83%E5%85%AC%E9%96%8B%E8%B3%BD%E7%94%B7%E5%AD%90%E5%96%AE%E6%89%93%E6%AF%94%E8%B3%BD页面是2012年的比赛结果,不符合用户需求的2008年,为不相关

  德国汽车寻找德国汽车的信息,或德国汽车制造商的官方主页http://www.subaru-china.com.cn/这个结果是斯巴鲁汽车的官网主页,但是确实日本车,完全不符合用户需求,不相关

  Gmail 登录访问gmail的官方登录页面http://mail.163.com/该结果是163的邮箱登录,并非gmail登录,不相关

  北京 上门灭鼠公司寻找北京室内可以提供上门灭鼠服务的公司http://ych.100ye.com/msg/32439614.html用户需求是北京的公司,该页面提供的是江苏的公司,无法满足用户的需求,算不相关

  华山的最高峰信息需求,想找到华山的最高峰信息http://news.4399.com/news/20090728-13150.html这个页面仅仅是关键字命中但实际并不相关,需求是最高峰,但是实际页面是“华山论剑反馈高峰”,结果虽然命中关键字但是转义严重,不相关

  东北往事之黑道风云20年 演员表信息需求,想知道具体的演员表是什么http://www.tianya.cn/publicforum/content/free/1/1632439.shtml这个页面看起来很相关,但是实际上是一个网友自己的假设,query需求是真实演员表,不满足需求

  初中寒假实践小结文档需求http://www.rudangwang.com/article/20100913/69890.html关键字堆砌,正常人难以理解的句子:“措置惩罚需要别人解答的题目不敷成熟、书册常识与现实联合不敷精密等需要别人解答的题目”

  公务员惩戒调理正确query,即用户需求应该是“公务员惩戒条例”http://www.zaoxiejz.com/tiaoli/716/页面内容无法阅读,语句类似:5月20日傍晚,早泄治疗捌法问他是否愿意捐献。在查证核实之后,那么依照《行政机关公务员处分条例》第十七条的规定,早泄延时中药今天的公司,分析道路交通流量、流向变化,早泄 延时锻炼器

  QQ聊天记录不见了怎么办?信息需求,寻求解决方法http://wenda.tianya.cn/wenda/thread?tid=6423f74d445e880d&hl=fr 问题相关,实际回答完全无关,是关于如何破解密码、聊天记录的团队广告,基本没有价值

  2011321福彩太湖字谜信息需求http://tieba.baidu.com/f?kz=1294450452仅title命中好,实际完全不相关

  初三化学试卷初三化学试卷的浏览、下载需求http://www.5ykj.com/Article/xxywstzl/94674.htm 试卷下载分享,其中没有任何例题等,完全无法满足

  7、死链

  如果页面死链导致你无法进行打分评估,请选择 “死链”,死链的类型主要有以下几种类型,下面会单独做详细说明。

  ü 页面抓取不成功,且点击url打开也无法加载,无实际内容;

  ü 页面报错提示页面:除了报错信息外,页面上没有其他内容;

  ü 标准报错页面:网站直接返回的标准出错页面;

  ü 网页恶意软件提示,如“请注意,访问此软件可能会损害您的计算机”;

  7.1 死链类型:网页安全提示

  有些页面显示为空白页,点击url后的页面显示“请注意,访问此软件可能会损害您的计算机”,一般情况下,有些页面虽然会有不安全的提示,但是他们不应该直接被抛弃,例如有的政府网站,访问时也会提示说安全证书不被信任,但是可以点击“忽略风险”继续打开页面打分。

  如果你的确认为该页面风险很大,如url很奇怪,可能导致电脑中毒等,那么可以不继续,而选择“抛弃”,并标记为“死链”。典型的网页安全提示警告信息如下:

  7.2 死链类型:空页面或未能访问页面

  主要指抓取的实际页面为空,点击url后,在较长时间内,网站都没能显示出来,或者显示出来了,但是实际页面却为空的。

  但是,点击url后,如果整个页面中有些内容加载出来了,而有些没加载出来,是需要按照加载出来的内容实际进行评分的。

  7.3 死链类型:页面报错提示

  主要是网站自身变化引起的,会直接给予提示文字,例如:

  ü 页面不存在

  ü 内容已转移

  ü 帖子已删除

  ü 域名过期或出售

  ü 空间被关闭

  ü 网站要备注,等

  ※ 注意:对于有些死链,当我们直接点击url会显示为死链(如内容已删除),然后直接跳转到首页,这类也标记为死链。

  典型的范例:

  7.4 死链类型:标准报错页面

  主要是标准的出错页面,例如:

  ü 401,未授权

  ü 403,禁止访问

  ü 404,未找到文件

  ü 500,服务器内部错误

  ü 503,服务器当前无法处理

  不同的网站,不同的浏览器可能显示不同,典型范例截图:

  Part5 特定类型打分举例说明

  1、打分一些重要原则

  在正式进行query-url质量评估举例说明前,先说一下打分的一些重要原则,有些在前文中已经提到,在此进一步强调,主要包括以下几个方面:

  ü 把自己当成真正的用户:你必须将自己当做是真正的用户,从用户角度作出评估;

  ü 用户真实需求判断:你评估具体页面时,首先要明确用户在query背后的真实需求是什么(一般可以基于你的评估经验、你的经验常识以及基于网络搜索去了解query需求),然后根据页面对用户需求的满足程度打分;

  ü 冷门需求打分较低:有些query具有多种需求,冷门的需求应当酌情给出较低的评分

  ü 纠结的分值判断:对于有些在2个分值中纠结的情况,一般根据自己的分析后给出合理的判断,想想需求满足程度。如果3个分值都在考虑范围内,那么请直接使用居中的那个分值。

  ü 2分、1分和0分的简单法则:如果你认为一个页面对用户没什么帮助,请打一个较低的分数,说明如下:

  l 2分的结果必须对用户需求有帮助,能为用户需求满足提供一些价值;

  l 1分页面的价值较低,但是必须跟query主题是相关的;

  l 0分页面完全没有价值,或者跟query主题不相关;

  2、query主体是否确定与需求是否多样

  在评估打分过程中,针对query需求会存在下面3个角度,在Part3“理解query需求”中已经介绍过,包括:

  Query主体表意:是确定还是非确定的区分;

  Query需求维度:存在需求维度单一还是多样的区分;

  Query需求强度:即针对query不同主体表意和需求维度,存在需求强度大小之分,分为主要需求、泛需求、小众/冷门需求三类。

  针对这几个角度,这里实际打分进一步说明,存在以下原则:

  ü 通常,主体表意、需求维度如果小众,打分会较低;

  ü 满足一般需求强度的语义表意和需求维度的页面,打分中不会降分;

  ü 存在明显主要的主体表意和需求维度,才能打4分;

  2.1 query主体确定,需求维度单一

  当query主体确定,不存在多义情况下,且需求维度明确单一,打分主要依据页面对query单一需求的满足程度,打分从4-0的范围,具体举例说明如下:

  Query用户需求意图URLUrl说明

  美图秀秀在线下载美图秀秀软件下载http://xiuxiu.meitu.com/download/4分,官方下载页面

  http://down.it168.com/162/165/109185/;

  http://xiazai.zol.com.cn/detail/34/330483.shtml3分,知名大站下载页面,能够下载安装

  http://sj.zol.com.cn/detail/20/19660.shtml2分,手机版美图秀秀下载,非主需求

  http://8.app.meitu.com/1分,美图官网超能力测试页面,该页面本身与query不太相关,页面底部有下载链接,

  http://download.digi.tech.qq.com/a/20110118/000003.htm 1分,在线版美图秀秀介绍页面,有在线链接,为下载需求的替代需求,很少量满足需求,1分

  http://bbs.waptw.com/topic/qnas/view/fid:2/tid:3227207/page:0/order:asc/0分,页面主题是美图秀秀下载了怎么不能用,不能满足用户需求

  Query用户需求意图URLUrl说明

  兰溪地图在线浏览地图,或下载地图http://map.baidu.com/?newmap=1&s=s%26wd%3D%25E5%2585%25B0%25E6%25BA%25AA%25E5%25B8%2582%26c%3D1462&fr=alat0&from=alamap知名的百度地图的地图页面,可支持各种检索3分

  http://www.9tour.cn/maps/detail_31_60682_3.html地图图片,无法支持各种检索,可保存,站点非知名,2分

  http://zhidao.baidu.com/question/109559476.html兰溪地图售卖相关的知道问答,极少数人需求,1分

  http://www.ddmap.com/map/21----%C0%BC%CF%AA%C2%B7+%CA%D0%C7%F8%BC%B6%D2%BD%D4%BA----pvs/上海兰溪路上XX医院,不符合用户需求,0分

  2.2 query主体确定,需求多样

  即query主体是确定的,没有多种表意,但是该表意下需求维度多样,需求维度存在需求强度主次之分,不同需求强度打分不一样,需求强度小的打分会低。

  如query【赵薇】,主体表意明确,就是明星“赵薇”,但是用户需求维度多样,如介绍、新闻、视频、音乐等。

  Query需求维度中主次之分用户需求意图URLUrl说明

  主要/重要需求官方微博、博客寻址http://weibo.com/zhaowei官网微博,4分

  介绍需求http://baike.baidu.com/view/3255.htm百科介绍也是重要需求,内容很优质、丰富,3分

  赵薇参演的电影、电视剧等影视在线观看需求http://www.youku.com/star_page/uid_UNTU4MjQ=.html电影也重要需求,优酷专题,很多电影可以在线观看,3分

  次要需求赵薇参演的某部电视剧的在线观看需求http://www.youku.com/show_page/id_zcbfe6706962411de83b1.html赵薇出演的一部电视剧的在线观看,2分

  和赵薇有关的最近的某个热度一般的新闻http://news.jschina.com.cn/system/2012/03/07/012880473.shtml 与赵薇有关的电影的某个近期新闻(用户搜索query时间为2012.3.10),2分

  冷门需求赵薇以前的新闻http://news.qq.com/a/20100924/000701.htm与赵薇有关的过去发生的新闻(用户搜索query时间为2012.3.10),2分

  无需求——http://dzh.mop.com/whbm/20090827/1/3758SSI1c03d7azg.shtmlTitle有赵薇,但是实际内容与赵薇没有任何关系,0分

  如query【兴业银行】,主题表意明确,但是需求维度多样,包括信用卡、网上银行、股票、介绍等多方面。

  Query需求维度中主次之分用户需求意图URLUrl说明

  主需求官网http://www.cib.com.cn/n官网,4分

  重要需求/次要需求兴业银行信用卡http://creditcard.cib.com.cn/card/信用卡也是重要需求,3分

  股票行情http://www.xcar.com.cn/bbs http://cj.gw.com.cn/news/stockData/SH/66/SH601166/detail.shtml股票行情,走势2分

  股票行情、公司业绩讨论http://news.jschina.com.cn/system/2012/03/07/012880473.shtml股票兴业银行论坛,出自股吧2分

  实体银行位置http://map.baidu.com/?newmap=1&s=con%26wd%3D%E5%85%B4%E4%B8%9A%E9%93%B6%E8%A1%8C%26c%3D131&fr=alae0&ext=1&from=alamapQuery查询地,兴业银行实体位置。2分

  兴业银行招聘信息http://bbs.yingjiesheng.com/forum-247-1.html招聘论坛,2分

  各营业网点电话http://www.cib.com.cn/netbank/cn/About_IB/Outlet_Locator.html各营业网点电话。2分

  小众/冷门需求关于该银行的新闻http://finance.qq.com/a/20120425/004230.htm关于该银行业务的一篇新闻,1分

  兴业银行公司介绍http://baike.baidu.com/view/34166.htm百科的词条,介绍该公司的情况,2分

  法国兴业银行http://news.qq.com/a/20080125/000393.htm1条08年的法国兴业银行信息,1分

  2.2 query主体表意不确定,需求多样

  评估者可能会碰到一些具有多种表意需求的query,如前面一直提到的【苹果】、【土豆】的例子。打分的基本原则是:表意少的打分低,常见最主要的表意需求打分高。

  主次需求Query 范例打分范围

  主需求

  Apple,主需求是苹果品牌;

  Windows,主需求是windows操作系统;

  京东,主需求是京东商城电子商务;

  豚鼠,主需求是介绍、与这种动物相关的信息(这个为3-0)

  天龙八部,主需求是网络游戏相关4到0分,其中部分query不可以拥有4分结果

  重要需求/次要需求Apple,稍次的需求为苹果这种水果的信息,或翻译单词等

  Windows,稍次的需求为单词翻译,或者有关窗户的信息;

  天龙八部,林志颖版电视剧属于需求强度一般的需求维度;3到0分,没有4分的情况;

  小众/冷门需求

  BBS,比较冷门的需求为德国的一个汽车零件生产商

  星座,比较冷门的需求是某游戏中名为星座的武器

  天龙八部,关于“天龙八部”的来历2到0分,需求强度比例越小,所给打分越低;

  不可能的需求

  荷兰猪,绝大部分是找豚鼠,而非是生长在荷兰的普通猪0分

  下面结合query主体表意多样与需求维度的多样,从而确定的需求强度,来举例说明需求强度对打分的影响,以query【苹果】为例说明:

  Query主体表意上的主次之分需求维度URLUrl说明

  主需求:苹果的品牌产品

  (4-0分)苹果官网:重要需求http://www.apple.com.cn/4分,苹果品牌的官网页面,满足主要表意需求好结果

  苹果产品:重要需求http://detail.zol.com.cn/cell_phone_index/subcate57_544_list_1.html3分,苹果手机相关产品的介绍评论页面

  苹果公司介绍:次要需求http://baike.baidu.com/view/15181.htm2分

  苹果公司总部大楼:冷门需求http://wenku.baidu.com/view/5950321214791711cc791743.html1分

  重要需求/次要需求:水果、电影

  (3-0分)苹果这种水果介绍:次要需求http://baike.39.net/8000-8300-8301-1/2分

  宠物吃了苹果后的反应:基本无需求http://zhidao.baidu.com/question/363505443.html0分

  电影视频:次要需求http://www.167b.com/ysxx/151.html2分

  电影介绍、演员等http://ent.people.com.cn/GB/8222/42057/83496/index.html2或1分

  小众/冷门需求:苹果摄影

  (2-0分)沈阳苹果摄影:冷门需求http://www.applephoto.com.cn/1分

  2.4 特殊说明:需求维度的泛化与具体

  下面从另一个维度,看同一个主题的query的需求维度的泛化与具体,以及对打分的影响。

  有的query是需求比较泛的查询,但有些query是需求描述非常具体的query,以下是一些这些不同query之间比较的例子:

  Query略具体的需求较具体的需求

  椅子餐厅椅宜家 高后备、带扶手、软垫的椅子

  数码相机尼康 数码相机尼康 d5000 数码相机

  丰田丰田 混合动力丰田 普锐斯 2010

  历史哈佛历史哈佛 人类学 历史

  面试问题教师面试问题对于中国小学语文教师的面试问题

  对于需求非常具体的query来说,好的页面应该很好的匹配query中所涵盖的要求,如果二者不是非常匹配的时候,需要认真考虑二者之间的匹配程度,来判断该页面对于用户需求的满足程度如何,从而做出合理的打分,以下是一些具体的例子。

  Query用户需求意图URLUrl说明

  数码相机

  用户对数据相机有兴趣,想了解相关的内容或者买一个相机http://detail.zol.com.cn/digital_camera_index/subcate15_list_1.html3分,很多机型的列表页面,信息很丰富

  http://www.360buy.com/products/652-654-831.html3分,很多机型的列表页面,介绍详细,京东是著名的电子商务网站,可以方便购买

  尼康 数码相机

  想了解尼康数码相机的相关信息,或者买一个

  http://www.nikon.com.cn/sc_CN/products.page?CategoryID=glxlvehu3分,尼康官网上的一种类型的数码相机页面,但尼康官网上还有其他的数码相机,所以不适合打4分

  http://detail.zol.com.cn/digital_camera_index/subcate15_657_list_1.html3分,优质站点的尼康数码相机页面

  http://www.nikon.com.cn/sc_CN/products.page?CategoryID=glxlvehv2分,官网尼康数码相机P系列,比query需求更具体

  北京 沃尔玛

  找北京的沃尔玛超市相关信息,如地点、营业时间、活动等

  http://www.wal-martchina.com/walmart/store/2_beijing.htm4分,官网上的北京沃尔玛的分店信息

  http://map.baidu.com/?newmap=1&s=con%26wd%3D%E6%B2%83%E5%B0%94%E7%8E%9B%26c%3D131&fr=alam0&ext=1&from=alamap3分,较官方页面给出的分布地图

  http://zhidao.baidu.com/question/291303458.html2分,知道回答只有少数几家店,不足以满足用户需求

  http://s.baidu.com/shop/739faf3f97d1ebf31a07f20e2分,沃尔玛的北京某具体分店,通过链接可以知道其他更多分店信息

  也因为在用户需求非常具体时,容易有一些页面与query的匹配程度并不太高,这时候就需要评估者认真分析,看这个页面与query到底有多相关,到底多大程度上能够满足用户的需求,并且做出打分。

  以下是一些匹配程度或好或差的例子:

  Query用户需求意图URL说明

  教师面试问题

  查找教师面试时会面临的问题

  http://wenku.baidu.com/view/238091282af90242a895e591.html

  文库结果,有很多面试问题可以参考,内容丰富3分

  http://dongqianxiaoxue.lingd.net/article-4102279-1.html页面主题比query更具体,是小学老师面试题,但是很多是通用的问题,2分

  http://wenku.baidu.com/view/75758019964bcf84b9d57b3c.html 文库结果,页面话题更泛,更多是考试相关,面试只是其中一点,但是还是有一点价值的,1分

  http://wenku.baidu.com/view/195d4b6d7e21af45b307a825.html有很多面试题,但是并不太适用于教师,由于教师职业本身的特殊性,这个结果几乎没有用,0分

  宝马Mini

  用户可能是想买车,希望得到这个车型的相关信息,此车分为CABRIO、CLUBMAN、COUNTRYMAN\COUPEROADSTER等多个款

  http://www.minichina.com.cn/mini/cn/zh/index.html官网,车型齐全优质,4分

  http://db.auto.sohu.com/brand_202/index.shtml 权威网站的页面,有多个系列,全面优质有报价图片等,3分

  http://www.minichina.com.cn/mini/cn/zh/mini_coupe/index.html 官网中该系列中的一款,比query范围稍小些,3分

  http://www.minichina.com.cn/mini/cn/zh/model_comparison/index.html 官网上Mini不同款车的自助对比页面,需求满足程度稍低些,3分

  http://drive.xcar.com.cn/201202/news_406050_1.htmlMini某款车COUPE ROADSTER的介绍,2分

  http://www.minichina.com.cn/mini/cn/zh/accessories/xmas_promotion/index.htmlMini车的装饰包,需求程度很低,1分

  3、特定类型的query打分举例说明

  在这部分,我们会举例介绍一些特定类型和特定url页面评估。例子只能覆盖一些特定的类型,不能穷举你遇到的所有情况,所以在你做评估打分的时候,永远需要记住的是用户的需求意图是什么,评估的页面对用户需求满足程度如何。

  3.1 实体类query

  3.1.1 名人类

  名人类query即提到该人,大多数脑海里都认为的那个人,一般明星类、公众人物、体育人物等有一定知名度、被公众知晓的人物都可以列入其中。

  名人一般会有4分权威结果,存在主要表意需求。

  Query赵薇

  Query说明赵薇是知名的娱乐明星

  用户需求意图信息需求:想知道有关于赵薇相关的信息

  娱乐操作需求:

  4http://weibo.com/zhaowei赵薇的官方微博

  3http://baike.baidu.com/view/3255.htm赵薇的百科介绍

  3http://tieba.baidu.com/f?kw=%D5%D4%DE%B1&fr=ala0赵薇的贴吧

  3http://www.youku.com/star_page/uid_UNTU4MjQ=.html赵薇的介绍、视频列表页,视频可以观看

  3http://www.baidu.com/s?tn=baidurt&rtt=1&bsst=1&wd=%D5%D4%DE%B1赵薇的最新新闻搜索结果页,页面内容都是相关的,质量较好

  2http://www.youku.com/show_page/id_zcbfe6706962411de83b1.html赵薇出演的一部电视剧《老房有喜》的在线观看

  2http://gb.cri.cn/27564/2012/03/30/1326s3622596.htm与赵薇有关的某条最近相关新闻“林心如赵薇谢娜李湘何炅 明星惨不忍睹的照片”

  0http://dzh.mop.com/whbm/20090827/1/3758SSI1c03d7azg.shtmlTitle有赵薇,但是实际内容与赵薇没有任何关系

  3.1.1 非名人

  普通人物指非知名的人物,我们无法知道用户到底找的是哪个人。如果有多个人叫这个名字,则关于该人名的网页,不管是介绍的是同名的哪个人,一般都给1分,除非某个叫该名字的人略知名些,如在新闻等曾经被报道等,且页面质量较好,这时候可以打3分或2分。若结果中多个叫该名字的人,如百科有多人介绍,可以2-3分。

  Query李小敏

  Query说明有非常多叫李小敏的人,也没有非常知名的人

  用户需求意图信息需求:想找跟叫“李小敏”相关的信息

  3或2http://baike.baidu.com/view/1399700.htm百科有多义项,同一个页面上有多个同名人物的介绍,丰富度高

  2http://www.jstv.com/s/jszy/lxm/ 江苏省委常委、省委政法委书记李小敏,比非常不知名的略有价值

  1http://esf.sh.soufun.com/a/lixiaominrita某个叫李小敏的房产经纪人,对大多数用户价值较低

  3.1.2 地点名

  对于一些地名,政府官方网站作为权威网站,可以给4分,其他结果根据需求强度和满足情况做适当打分。

  Query长沙

  Query说明长沙是湖南的省会城市

  用户需求意图信息需求:长沙相关的信息,需求很广泛,如天气、地图、介绍、政府机构、旅游信息等。

  4http://www.changsha.gov.cn/长沙市政府网站

  3http://baike.baidu.com/view/7127.htm百科介绍,重要需求之一且内容丰富

  3http://www.weather.com.cn/weather/101250101.shtml当地天气,比较重要需求

  3http://map.baidu.com/?newmap=1&s=s%26wd%3D%25E9%2595%25BF%25E6%25B2%2599%25E5%25B8%2582%26c%3D158&fr=alac0&from=alamap当地地图,比较重要需求

  2http://tieba.baidu.com/f?kw=%B3%A4%C9%B3&fr=ala0当地贴吧,较主要需求

  2http://www.cshr.com.cn/index.asp当地人才网站等比较重要的网站

  2http://www.csup.gov.cn/长沙的各类非省政府的重要机构站点

  1http://tieba.baidu.com/p/1056453660当地贴吧的一个具体帖子

  1http://zhidao.baidu.com/question/279702629.html有部分长沙工作环境的介绍。另外,关于长沙一般的小站点、小机构的相关信息可以给1分。

  0http://www.iphoto9.com/contents/23/505.html 实际页面与长沙关系并不大,基本不能满足用户需求

  3.1.3 公司名

  公司类需求一般找公司官方网站、公司介绍信息、地址、联系方式、评价信息,所经营业务(如产品、服务)等相关信息。

  以【东方票务】为例进行说明

  打分URL说明总结说明

  4http://www.ticket2010.com/官网,4分官网

  3http://www.ticket2010.com/project_index.aspx

  重要二级频道,3分;

  官网重要频道;质量好的公司介绍页面(含介绍、地址、联系方式、网址等较丰富信息)

  3http://www.dianping.com/shop/2753518基础信息之外还有点评、人均价格、地图等信息,页面质量好、可信,3分

  2http://www.ticket2010.com/aboutus.aspx官网上的介绍我们,用户需求不大,2分官网上的普通二级频道、介绍页面、微博等视与公司经营等有多大关系,数量如何打分

  2http://okcard.blemall.com/merdetail_ddshh-81112.html介绍页面,有官网网址,需求较少,2分

  2http://weibo.com/u/2051100135官网微博,与票务有关的内容较多,2分

  1http://sports.eastday.com/eastday/tickets/东方网上共建频道,链接基本已经全部死链,内容都是07年之前的,仅电话等需求可以满足,1分页面低质、内容不全、页面过于具体、很久没更新的时效性很差的页面

  1http://www.ticket2010.com/program.aspx?id=8085官网上非常具体的页面,1分

  1http://t.dianping.com/deal/3599东方票务产品的过期团购页面,1分

  3.1.4 产品名

  下面介绍一些通用的原则,但是实际评估中还是根据实际用户需求和页面对用户需求满足程度打分:

  ü 详尽的专题页面,至少包含介绍、报价、评论、参数,3分;

  ü 专题页面仅能其中覆盖部分类别、或内容稍少、时效性略差,以及比较详细丰富的单一页面,2分;

  ü 关于这个产品的相关信息,但质量较差,或者过期的产品介绍信息等,1分;

  ü 仅仅是文中提及这个名词,没有任何相关介绍,例如“我明天想去买个XX产品”,0分;

  Queryhtc G16

  Query说明Htc G16是一款智能手机

  用户需求意图信息需求:用户找介绍、评论、价格等信息,使用方法等。

  交互操作需求:在网上购买手机、软件下载等

  3http://detail.zol.com.cn/cell_phone/index272619.shtml知名IT网站中关村在线关于该款手机的专题页面

  3http://product.pconline.com.cn/mobile/htc/453778.html同样的知名网站的专题页面信息

  2http://zhidao.baidu.com/question/340485518.html相关的评论信息,2011.11月的,时效性还好,回答较有价值,但不是特别丰富

  2http://baike.baidu.com/view/6227635.htm百科的介绍信息,不如好的专题好,没有评论、报价等信息

  1http://wenku.baidu.com/view/d1f3b46627d3240c8447ef8f.html页面介绍HTC从G1到G16,少量信息跟G16相关

  0http://bbs.qdit.com/thread-635915-1-1.html页面价值很低,基本没啥价值

  3.1.5 学校名

  找学校,一般主要的需求为官网,为4分。重要的需求有介绍、考试招生、新闻、学院等各方面信息。根据需求强度的不同和页面对需求满足程度,可以3-0分。

  Query北京大学

  Query说明国内知名高校北京大学

  用户需求意图信息需求: 找北京大学相关的各方面信息,如介绍、招生、考试、新闻、贴吧、论坛等;

  寻址需求:去北京大学的官方网站;

  4http://www.pku.edu.cn/北京大学的官方网站

  3http://baike.baidu.com/view/1471.htm北京大学的百科介绍

  3http://grs.pku.edu.cn/

  http://www.gotopku.cn/ 北京大学校内重要的机构,如招生网站、研究生院等,给3分

  3http://kaoshi.edu.sina.com.cn/college/c/10001.shtml 新浪中北大的招生专题,对于参加高考的学生家长很有价值

  2http://pkunews.pku.edu.cn/北京大学新闻网,对部分用户有价值

  2http://news.baidu.com/ns?cl=2&rn=20&tn=news&word=%B1%B1%BE%A9%B4%F3%D1%A7&ct=1&fr=ala0北京大学的新闻检索结果页,没有非常有名的新闻,对部分用户有价值(query日期为2012.3.31)

  2http://www.bjmu.edu.cn/北京大学医学部,需求强度略弱,对一些用户有价值

  1http://epaper.jinghua.cn/html/2011-01/17/content_623924.htm1月份的一篇关于北大的新闻,时效性不太好,对用户价值不太高

  0http://zhidao.baidu.com/question/330356982.html转义的结果,关于“北京有哪些大学不错”

  3.2 信息类需求

  信息类需求是搜索引擎需求中较大的一类,一般主要考虑页面提供的信息是否满足了用户的需求,信息是否丰富、真实、获取便捷等。

  下面重点说明3种特殊的信息类需求,包括key-value、原文、问答类。

  3.2.1 Key-Value需求

  所谓的key-value,即用户需求是一个key,但是希望获取value的信息,如姚明身高(身高是key,value是2.26米)、北京海淀区政府地址、联想客服电话等。

  所以我们需要关注页面是否提供了value相关信息,以及value信息是否可靠真实的。

  Query亚伯拉罕·林肯 生日

  Query说明美国总统亚伯拉罕·林肯的生日

  用户需求意图信息需求:生日是哪年哪月那日

  3http://zhidao.baidu.com/question/14773657.html较好的说明页面,页面主题很集中,3分

  2http://zhidao.baidu.com/question/282698922.html 此网页包含所有美国总统的生日,找到林肯生日的成本较高,2分

  1http://dongxi.net/b14tv该页面较高成本可得知,林肯出生于2月12日,但是无哪年,1分

  1http://www.miniworld.com.tw/article/love2a2a2002/1530644 该页面只表明哪月哪天,但是没有说明是哪年,对于大部分用户来说价值比较低,1分

  3.2.2 原文需求

  原文需求,指用户输入的query,是要某一篇具体的文章,通常用文章标题、文章中的某一句话等搜索。而且通过该query,就可以定位到某篇具体文章。

  原文需求常见有两类:

  ü 找某篇文章,那么只要找到具体文章,然后根据文章质量等给出打分;

  ü 找某个题目的答案,这种如果只有找到该题目文档,没有答案,那么一般只能给1分,有答案根据获取成本(是否便捷)给2-3分。

  举例说明如下:

  Query痛苦抉择背后,究竟有何隐情?

  Query说明一篇新闻稿标题

  用户需求意图信息需求:了解阅读这篇新闻

  3http://news.sina.com.cn/o/2011-12-09/064023602478.shtml权威网站上提供的新闻稿

  Query一切导体都有阻碍电流的性质,导体的这种性质叫_____________

  Query说明初三物理单元测试题原文

  用户需求意图信息需求:找到这道题目的答案

  3http://zhidao.baidu.com/question/111308844.html直接给出了正确答案,3分

  3http://www.jyeoo.com/physics/ques/detail/8f22759b-651e-4a7a-b6c9-4e3c175f5057试题解析,直接给出此题答案,3分

  2http://apps.hi.baidu.com/share/detail/30942484试题集合,有答案,但查找十分困难,2分

  1http://space.30edu.com/05384423/ReadArticle.aspx?ID=f9dc87c4-b6b8-45c1-a4f1-687f6a75e6c6找到了该试题,但是没有答案,给1分;

  注意:原文query下,url往往只要命中这句话,能够得知来源、前后文、出处等,至少是相关的,也就是非0分的。根据质量好坏、完整与否来判断需求满足情况,往往给1-3分。如果确定是始发原创,也可以给4分。

  Query需求URL与打分易错点

  镇压天地原文query,实际是某小说的章节名http://www.00ks.com/Html/Book/14/14695/3712819.html

  该章节小说阅读,3分可满足主需求的结果,打分一般都较高,需要先确认好主需求才打分

  sqlite3 error lnk1181: 无法打开输入文件 d:原文query,通过这种方法来满足疑难求解需求http://hi.baidu.com/liyy011/blog/item/7a7ff0d8937300e738012f42.html,1分,命中了该段语句,但是实际满足程度比较差主需求,在页面较差的时候,只要满足一点需求,就不应当0分

  大家都认为初三的甲某比较厉害.有一天,甲某向初一的乙某借钱,乙某因惧怕甲某,被迫原文需求,既想知道出自哪里,也想知道答案http://zhidao.baidu.com/question/206573018.html;只有问题集合,且找到问题原文的成本稍大,无答案,2分

  原文类query需要使用ctrl+f进行查询,以免实际包含该query的页面,被误当不相关

  第一次握你的手

  原文query,实际是歌词中的一句,需要找到对应的歌词、歌名http://zhidao.baidu.com/question/293223588.html

  http://zhidao.baidu.com/question/397707

  均有歌词,3分主需求就是所在歌词,只要能满足,打分不能过低

  劳其筋骨饿其体肤原文需求,了解出处、渊源,因是古文可能还有释义需求http://blog.csdn.net/arielxp/archive/2004/08/12/72003.aspx

  http://v.youku.com/v_show/id_XMTkyMTk4NzMy.html

  均为1分,实际只有title相关可知道上下文信息,页面内容和视频均完全无关即便是原文query,也不能直接认为命中的一大段话, 就一定到2分,需要看其多大程度的满足用户需求,是只有一小段原文命中,整体无关,还是整篇原文或者对小段原文的深入阐述

  原文Query有时候出现在整篇文章中的某一处,不易查找,此时可以用浏览器的查找功能进行查找。使用Ctrl+F热键,唤出查找界面,然后输入Query在网页中进行查找。

  对于较长的Query,尤其是含有标点符号的Query,可能会因为些微的差异或者标点符号全角半角的原因而查找不到。此时建议使用Query的一小部分进行查找。

  例如对于Query【天将降大任于斯人也,必先苦其心志】,可能网页中的确含有这句话,但因为标点符号全角半角不匹配而查找不到。此时可以只查找“天将降大任于斯人也”,再看找到的部分上下文是否可以匹配Query。

  3.2.3 问答类query

  问答类query是非常常见的一种类型,即用户有问题,然后希望来搜索引擎搜索获得答案。

  一般衡量标准为:主要看问题是否得到回答,答案是否准确、直接、有效。过于专业的问题,参考回帖、评论等反馈来判断回答质量。如有可能,找到权威答案再判断。有问无答的页面一般给0分。

  Query网上银行汇款手续费怎么收

  用户需求意图信息需求: 找网上银行汇款手续费怎么收的信息,具体哪个银行不太清楚,希望知道手续费怎么收,收多少钱。

  3 or 2http://zhidao.baidu.com/question/134840510各个银行的手续费收取说明,质量好;但是时效性可能没有保障,有可能今年已经有更新了

  1http://zhidao.baidu.com/question/71194159.html只有一个银行的说明;且时间是2008年的

  1http://zhidao.baidu.com/question/287116756.html结果是关于手续费能否让收款人收,非常冷门的需求,对大多数用户都没有价值;

  0http://www.lzbs.com.cn/rb/2005-07/14/content_428393.htm网上汇款要当心,出了差错手续费照收。转义,无法得到手续费怎么收的情况;

  3.3 交互操作需求

  3.3.1 在线预订、购买需求

  对于在线预订、购买类需求,对站点知名度、操作有效性等要求较高,用户会认为知名权威的站点更可靠。

  Query北京到哈尔滨 机票预订

  用户需求意图交互操作需求: 找“北京到哈尔滨”的机票信息,并且完成在线预订等

  3http://flight.qunar.com/site/oneway_list.htm?searchDepartureAirport=%E5%8C%97%E4%BA%AC&searchArrivalAirport=%E5%93%88%E5%B0%94%E6%BB%A8&searchDepartureTime=2012-03-09&searchArrivalTime=2012-03-12&nextNDays=0&startSearch=true&from=qunarindex 优质网站的指定线路查询页面,用户需求满足较好

  2http://www.airchina.com.cn/?cid=bptopt0301中国国航的官网,可以输入城市名来预订

  2http://www.gz020hotel.com/jipiao/citytocity-PEK-HRB.html也是北京到哈尔滨的机票查询,但网站知名度低,认为权威性比较差,不一定准确

  1http://zhidao.baidu.com/question/286195840.html?an=2&si=1用户需求很明确,就是预订需求,此页面是关于预订的一些参考信息,对少数人来说有用

  0http://jipiao.quna.com/flightList/CA1640.html是指定线路的某一个航班的具体信息,但是无法预订

  3.3.2 游戏需求

  游戏类需求,主要为在线玩儿游戏、游戏下载,以及攻略、介绍、视频等需求。

  Query洛克王国

  用户需求意图寻址需求:去官网玩儿游戏;

  交互操作需求:在某个站点玩儿游戏;

  信息需求:找洛克王国攻略等相关信息

  4http://17roco.qq.com/官方在线玩页面,4分

  3http://www.4399.com/flash/32979.htm知名小游戏网站4399的洛克王国游戏,用户可在线玩儿,以及通过链接去官网玩儿

  2http://news.4399.com/luoke/xinwengonggao/洛克王国最新资讯信息专题

  2http://news.4399.com/luoke/gonglue/洛克王国攻略专题

  1http://jingyan.baidu.com/article/6766299710b1ed54d51b84a0.html洛克王国某一方面的具体攻略

  3.3.4 图片浏览

  图片的需求,一般越丰富、越清晰等越好,如果图片资源失效,无法查看,则没有价值。

  以【赵薇 图片】为例:

  URL说明

  http://gb.cri.cn/9964/2006/02/16/Zt114@902338.htm很多类型的图片,非常丰富,3分

  http://www.haibao.cn/star/1689/虽然图片也不少,但是毕竟凌乱无分类,而且页面有很多其他的主题,并非是图片专门页面,2分

  http://zhidao.baidu.com/question/142833250.html图片较少还算有特点,满足部分人需求,2分

  http://zhidao.baidu.com/question/142444328.html主要是文字描述,最佳答案所给链接不能满足,底部有个链接点击后可看到较单一的图片,1分

  http://zhidao.baidu.com/question/13949263.html无图片,无任何参考价值,0分

  3.3.5 小说阅读

  小说类需求主要为在线阅读,其次为下载等需求。一般评估原则如下:

  ü 原发官方书籍主页、目录页,4分,即使部分章节需要购买权限等也是给4分;

  ü 其他站点小说主页、目录页,更新到最新章节(或完结的有全部章节),都能免费在线看,根据页面质量3-2分,如广告太多,排版略差,给2分;

  ü 章节不太全,缺少少量章节, 根据页面质量,一般2-1分;

  ü 只有少量章节可在线看,其他缺少或需要权限阅读等,一般1分;

  Query斗破苍穹

  用户需求意图交互操作需求:主要是在线看斗破苍穹小说,其次为下载小说

  信息需求:小说介绍信息、小说评论信息等

  4http://www.qidian.com/BookReader/1209977.aspx 官网目录页

  4http://www.qidian.com/Book/1209977.aspx官网该书主页

  3http://www.laishu.com/doupocangqiong/其他小站转载的免费、全面文章,3分

  1http://www.morui.com/book/11/11386/index.html虽然看起来章节是全的,但是后面有些章节无法阅读

  1http://www.shuoshuo520.com/Html/0/391/3242188.html 其中的某一章节页面,点击可以回到目录页

  0http://www.xkzw.org/xkzw3232/为续集,非原需求的书

  3.3.6 软件下载需求

  官方网站上的下载页4分,其它最高给3。

  软件需求满足的关键因素能否下载使用,这是最重要的。若无法下载,对用户价值很低。软件query的打分,还要考虑软件的类型,是不是免费软件,要不要花钱。一些重要的参考原则如下:

  ü 如果是免费软件或不影响使用的共享软件,知名下载站的结果,可打3分。如搜【迅雷下载】,天空、华军、太平洋的下载页都能打3分;

  ü 若软件要花钱注册,不注册限制多难以正常使用,则受限版本的结果,用户信息获取的成本较高,给1分;能方便使用的版本,给2分或3分,如【photoshop下载】、【autocad下载】。

  ü 结果限定了要使用某种下载软件才能下载,要考虑下载软件的普及率。如很多用户都电脑都安装了迅雷,若大型的软件、网络游戏只能用迅雷下载,可默认用户安装了,不影响打分。如果要用网际快车(FlashGet)、才能下载,那就要减分,因为flashget普及程度相对低,很多用户没装。

  Query迅雷下载

  用户需求意图交互操作需求:下载迅雷软件

  4http://dl.xunlei.com/xl7.html官网下载页

  4http://dl.xunlei.com/官网,软件下载列表页

  3http://www.skycn.com/soft/14857.html知名网站下载页面,3分

  Queryacdsee下载

  3http://www.crsky.com/soft/9483.html破解版,不注册可使用,3分

  2http://www.51chongdian.net/soft/36/45/2007/20070606628.html破解版,但需要多次点击才能找到下载链接,便捷性较差,2分

  1http://www.skycn.com/soft/6612.html需要注册后才能正常使用,1分

  0http://www.yajyw.com/Soft/qtrj/200609/117.html不能下载,0分

  3.3.7 视频观看需求

  搜索电视剧、电影、电视节目,用户主要是想在线观看,其次是下载、介绍、影评、演员等。视频可分为单个和连续的。单个如电影、某期电视节目,连续的如电视剧、多期的综艺节目。

  评估时,主要考虑是否视频能否观看、清晰程度等。如果是连续性的,还要考虑排列是否有序、是否完整、有没有最新剧集。

  有些结果要安装软件或插件才能播放,这增加了成本,评分要比直接能看的低。

  视频类的搜索很少有4分,因为没有官方网站。一般评估参考原则如下:

  ü 剧集完整(连载更新到最新),排列有序,可以有效观看,3分;

  ü 丰富的百科介绍,根据需求情况,如果需求也较高,3分;

  ü 剧集不太完整(如缺少少数集数),排列不太有序,2分;

  ü 单独某一集,但能方便获取到完整剧集列表,2分;

  ü 需要安装Qvod、百度影音,但剧集更新到最新,根据质量情况,一般2分,如果页面质量很差,1分;

  ü 电视剧简单介绍、花絮和预告、单独具体某一集,一般1分;

  Query失恋33天

  用户需求意图交互操作需求:主要是在线观看《失恋33天》这部电影;购买电影票

  信息需求:了解影院信息、介绍信息、演员信息、评论信息等

  3http://www.tudou.com/playlist/album/id69874.html 完整版高质结果在线观看

  3http://www.letv.com/ptv/pplay/54534/1.html?ref=baiduopen完整版高质结果在线观看

  3http://baike.baidu.com/view/3158523.htm失恋33天的百科介绍,很丰富

  2http://app.ent.ifeng.com/movie/detail/4655该电影的介绍,海报等,次需求

  1http://tv.sohu.com/20111124/n326756810.shtml只有一小部分,无法观看正常影片

  1http://www.cnipr.com/news/dailykeyword/201111/t20111123_138699.html简短介绍,主要是因此而扩展出来的版权等相关思考

  0http://wenda.tianya.cn/wenda/thread?tid=16fl0lns843agjv9lpulgj8d8ckebqfr86g4vTitle中有失恋33天,但是实际页面是关于二维码的使用的

  3.4 寻址类型

  寻址类query,一般官网给4分,如新浪、4399、淘宝、北京大学等。。在4分介绍中说明已经较多,所以这里就不详细解说了。只列举一个例子,供大家参考。

  Query1号店

  用户需求意图寻址需求:找1号店官网

  信息需求:了解1号店这个网站相关信息等

  4http://www.yihaodian.com/官网,4分

  3http://e.weibo.com/yihaodian官网微博,页面基本上都是在介绍一号店的产品,3分

  3http://www.yihaodian.com/2/1号点北京分站页面,3分;如果确定query是来自北京用户,4分

  2http://baike.baidu.com/view/2164590.htm百科介绍,非主需求,2分

  2http://b2b.yihaodian.com/index.do企业频道,需求比例比个人低,2分

  2http://www.51fanli.com/product-633.html返利网上一号店的介绍、评论、优惠券等,2分

  1http://zhidao.baidu.com/question/355464402.html评论,相关但非主需求,1分

  1http://www.yihaodian.com/cmsPage/show.do?pageId=1186&merchant=2非常具体的官网内页,1分

  0http://www.21cbh.com/HTML/2012-3-6/5MMDQwXzQwNzI5MQ.html页面是“它是下一个1号店”,只有title好,实际是讲京东的,0分

  3.5 其他特定类型query

  3.5.1 色情需求

  当需求是寻找色情资源时,需要点到最后一步,确定能否真正获取到相关资源再打分。不要看到“看起来诱人”的词语就中止,因为存在很多虚假的色情网站,让人频繁点击,最后却只有广告,没有相关资源。

  一般没有提供真实色情资源的,即没有满足用户的需求,给0分。

  3.5.2 Url查询的query

  有些query直接就是某个具体的url,或者看起来和url非常相似,称之为“url查询”;

  url查询一般有下面两种形式:一是规范的典型url查询,二是非规范的url查询,但同样我们都认为是url查询的需求。

  (1)典型的url查询:

  即输入浏览器地址栏中,能直接打开某个网页,包括:

  ü Query本身就是一个完整的url,范例:www.youku.com

  ü 有些虽然没有前缀,但确实也是完整url的:xunlei.com

  (2)非规范的url查询

  有一些query看上去直观印象就是url查询,但是实际将这个url复制到地址栏时,却不能打开。虽然如此,我们仍然认为只要用户输入了一个明确的url,那么在用户心目中应当是有一个明确的页面的,一般包括:

  ü 跟正确的url一样,但是无法打开页面,比如该站点域名过期导致无法访问;

  ü url中存在明显输入错误的情况,如url完整,但是有拼错部分,范例:www.mcriosoft.com,明显可知是微软官网拼错了;

  ü url查询中包括了其他term,如【佳能D50 360buy.com】

  (3)非url查询

  ü Query本身没有www,com,cn之类的常见url前缀后缀,只有主域名,范例:youku

  ü Query本身直接是正常的中文query,范例:优酷、京东

  (4)评估注意事项

  对于url查询的query,请仔细查看评估页面的url地址,看跟query的url地址是否匹配。url查询的query很容易输入错,所以对于输入不完整以及不正确的url,需要仔细分析用户需求意图。

  4分的情况:

  ü 当url query跟页面的Url地址完全匹配时。注意:url页面的地址有时候可能会带有更长的一些字符串或者看起来跟query不一样,但是实际页面是一样的。如t.sina.com.cn与weibo.com即是同一个页面,但url不一样。所以对于query【t.sina.com.cn】,weibo.com应该给4分。

  ü 如果query的url不是完整的正确的,需要根据query分析用户需求意图,如果比较确信用户输入query所找的url页面跟评估的的页面一致,才给4分。如【www.mcriosoft.com】,显然是找微软官网,而query拼写错误了,官网为http://www.microsoft.com/en-us/default.aspx或者中文官网http://www.microsoft.com/zh-cn/default.aspx。

  当用户输入url query的时候,用户的需求目的很明确,往往是要去具体的页面。这些直接匹配的页面应该给4分。

  很少有直接匹配url query的结果,但是却不打4分的情况。有时候,直接匹配的4分页面是唯一对用户有价值的结果,但有时候,同时也存在一些其他对用户有价值的页面。如一些关于网站介绍信息的页面,这些页面打分可以从0-3档。大致规则如下:

  ü 目标url,4分;

  ü 频道页,3或2分;

  ü 网站统计信息,1 or 0分;

  ü 介绍信息,但是网站的介绍评论说明等页面,根据质量情况,可以给2-0分,如作弊广告很多,1或0分;内容较旧,一般给1或者0分

  3.5.3 输入错误的query

  在评估中,我们会遇到一些用户输入错误的query。一般评估原则为:

  ü 对于明显输入错误的query,你可以根据用户需求意图来进行打分,而不是用户实际输入的错误query;

  ü 对于非明显输入错误的query,可以就根据用户实际输入的query本身,来判断用户的需求是什么;

  ü 人名类query,如果发现结果url页面有直接跟query匹配的人物,那么一般不要猜测用户输入了错误的query,直接以用户输入的原query进行对应打分;如果一个人名下,同时可能有比较知名的人物跟该人名表述类似,可以根据你的判断,看是否对名人也有需求,从而对名人进行需求满足打分。

  下面是一些典型用户输入错误query的例子:

  QueryQuery真正表意urlurl页面说明打分

  奇异主要query表意为视频网站“奇艺”http://www.iqiyi.com/奇艺视频网站的官网4

  投书韵达快递Query表意需求为“投诉韵达快递”http://www.kuaidi100.com/all/yd.shtml韵达快递全国网点电话3

  人名的query比较难以判断,下面是一些例子。第一个query不应该认为是绝对输入query错误,第2个query是明显的query输入错误。

  QueryQuery真正表意urlurl页面说明打分

  陈格儿可能就是找“陈格儿”,而不要臆测用户找“陈格尔”http://t.qq.com/huaxianzi7一个叫“陈格儿”的人的微博1

  失传零花主要是找“石川铃华”这个AV女优http://baike.baidu.com/view/1751582.htm该女优的百科介绍2

  3.5.4 列表页需求query

  有些query,看上去用户是期望获取较多信息,而不是单个结果信息能满足需求,常见的好结果为一个相关列表,所以称之为列表页类需求query。这类query打分一般考虑结果提供信息的丰富程度。

  对于这类query来说,大致的判断原则为:

  ü Query所求的是一个列表时,一个页面上有多个相关结果,是列表页面时,往往比单条结果好;

  ü Query所求的列表比较短的时候,仅有一两个有效信息条目的结果,也还算有帮助,但价值并不一定高于单条优质的结果。

  Query需求URL与打分说明

  鸡肉食谱

  有关鸡肉的食谱,用户希望从中挑选从而做菜,有列表需求,对丰富程度有要求

  http://www.meishichina.com/YuanLiao/JiRou/,3分,优质页面,具有多种以鸡肉为主要食材的菜谱对于丰富度有较高的要求,根据其条目多少,各条目的质量好坏来决定0-4之间的打分

  http://www.meishichina.com/Eat/Magic/200711/24321.html,2分,做法不是特别多,页面质量相对一般

  http://www.meishichina.com/Eat/RMenu/200803/32028.html,1分,只有一种菜的做法,丰富度比较差

  http://wenwen.soso.com/z/q125507923.htm,0分,仅仅提到了做鸡鸭的饭店,但是完全没有做法,无法满足用户需求

  婴儿玩具

  寻找婴儿玩具的相关信息或购买婴儿玩具

  http://category.dangdang.com/all/?category_id=4002067,3分,知名购物网站上的婴儿玩具专题,量大且相对权威根据页面实际的条目多少,来进行打分,条目越多、质量越高,则得分越高;任一者不够好,则需要适当降档打分

  http://www.baobeiwanju.com/,2分,多个品牌logo,点击可去往对应的淘宝商城,但是页面本身是非权威知名的

  http://www.amazon.cn/PLAYGO-%E8%B4%9D%E4%B9%90%E9%AB%98-%E5%A4%9A%E5%8A%9F%E8%83%BD%E4%B8%89%E8%A7%92%E6%B8%B8%E6%88%8F%E6%9E%B6-2249/dp/B003Z0CAQY/ref=sr_1_5?s=toys-and-games&ie=UTF8&qid=1331138950&sr=1-5;1分,具体的某个婴儿玩具,需求满足程度程度低

  http://search.yihaodian.com/s/c0-k%25E9%2581%25A5%25E6%258E%25A7%25E9%25A3%259E%25E6%259C%25BA,0分,遥控飞机实际不适合婴儿

  旅馆

  用户可能是想要旅行,因而需要订酒店,即使这个需求很泛,没有明确的具体限定,我们也可以判断出哪个结果好,哪个结果差

  http://hotel.qunar.com/?ex_track=bd_aladding_hotelsearch_title;

  http://www.ctrip.com/;

  两个3分结果,去哪儿,携程是比较有名的网站,可以方便的查询到各处的旅馆信息一些聚合信息的网站,例如去哪儿、携程等类似的网站,提供的信息非常多,往往打分会比较高,可以达到3分;对于一些比较知名的连锁旅店,给出官网也比较受认可,可达2分;

  对于非常具体的某个地方的某个旅馆,需求满足程度很低但至少是相关的,可以给1分;

  字面含义基本就是人所需要的旅馆,宠物旅馆符合用户需求的比例非常低,可以给0

  http://www.homeinns.com;2分,知名的连锁旅店官网,可以方便的查询预订

  http://www.7daysinn.cn/innpage.php?id=1151,1分,7天官网的某个非常具体的旅店,虽然也可以查询,但是整体稍差

  http://www.kudipetshotel.com/;

  旅店所指的是人所需要的旅店,宠物旅店的需求几乎没有,0分即可

  3.5.5 时效性需求query

  有些query,对时效性要求很高。如对于近期或突发的一些事件,用户希望看到最新的内容。如用户输入一个query来找体育赛事、每年的考试等,一般来说都是在最近的相关信息,而不是几年前的信息,除非query明确表述找过去某个时间的信息。

  (1)时效性类别:

  根据时效性特点,以及好的结果的特征,具有时效性需求的query大概可以分为以下几个类别:

  类型需求特征好的结果特征举例

  一般泛时效性主要需求维度上一直有时效性要求资源随时间一直有变化,能够较好满足用户需求的资源一般都是一年以内的A.商品名(未明确询价)且主需求是购买类,市场行情,商品对比,生活服务类查询(比如找保洁、搬家等服务信息)

  B.名人(不包括已故名人)

  C.最新政策、法规等(考虑更新频率,如几年更新一次法律不在此范畴,而关注是否是最新的法律条文)

  D.连载中的小说(因为大多更新周期不固定,不属于周期),热播电视剧

  E.媒体,如《南方周末》

  强泛时效性主要需求维度上一直有时效性要求资源更新频率高,只有最新资源(一天或几天以内)才能较好地满足用户需求,非时效性资源对用户伤害大A.天气预报,汇率,股票行情——每日更新

  B.各种价格,二手商品,房屋租赁,招聘,彩票,影院排片表,dnf封号查询,违章查询——过期信息基本无价值

  C.外挂、私服、激活码——失效快

  D.query中包含特定term,如:最新,新闻,XX小说最新章节,现在几点;

  E.无固定周期的排行榜,如金曲排行

  F.团购--过期团购信息价值低

  * 特例(资源更新频率低,但过期信息对用户伤害大):列车时刻表,火车票、机票查询

  * 注意:违章/火车票/机票/列车时刻/影讯查询:如是明确的查询寻址需求,不是此范围

  周期时效性

  主要需求维度上有时效性要求资源周期性更新或突增,但最新一个周期内的资源才是用户最想要的A.定期更新的漫画、动漫、电视剧

  B.定期播出的比赛、电视节目

  C.年度、季度、月度、甚至每周发布的排行榜

  D.节日、节气

  突发时效性主要需求维度上有强烈的时效性要求资源突增,非时效性资源不能满足用户需求即一般的社会事件,如最近发生的有一定影响力的地震、大火、洪水等都属于此范畴

  (2)评估中以下几个方面需要说明:

  ü 突发时效性:

  典型具有时效性要求的query如突发新闻事件等,如突然发生的地震、大火等,一旦时效性很差,没有给出最新的结果,那么有可能是不能满足用户需求,打分时可以因为时效性差,而打分比较低。

  ü 周期性事件的时效性:

  有一些query,是跟周期性有关,例如高考、奥运、世界杯等,是周期往复发生的,在这类query下,判断什么样的页面最有用之前,要考虑抓取结果当时该事件处于什么阶段,如果是一场比赛刚发生在几个月前,那么最有价值的页面一般都是刚过去比赛的相关信息,如果一场比赛在几个月后举行,那么最有价值的页面是有关于即将举办的比赛有关信息,这方面需要做一下判断。

  如果页面是事件的官网,那么可以给4分,不管事件是过去还是即将到来的。

  ü Query有明确时间:

  “中国人口”,往往是需要最近的统计数据,比如最新一次数据产出于2012年,之前的结果就都不如2012的结果好,在同样质量、同样相关的情况下,时效性差的结果应该适当降档。

  如果query是【1980年中国人口】,那么就不存在内容是否最新的,而是是否提供了query表述的信息。有时候,旧的页面是唯一的满足“过去事件”的好资源。旧的页面并不一定就是差的,这主要取决于用户的需求和页面内容匹配程度。

  ü 页面显示时间与页面内容时间

  大多数时候,你需要看页面实际内容描述的时间,而不仅是页面上显示的时间。

  ü 时效性有时不需考虑

  有时候,时效性差的网页反而是唯一的关于某事的好结果。时效性差的结果,未必一定是差结果,需要根据实际情况来分析。

  Query需求URL与打分易错点

  鸦片战争较久以前的鸦片战争的信息需求http://book.360buy.com/10880231.html,2分,京东上某本关于该战争的书,虽然已经比较久了,最近一次修订已经有些年,但是本身是历史事件,对于时效性要求不高对于比较久远的事情,时效性需求往往并不高,即使页面内容时效性稍差,但往往也不需要特意降档

  奥黛丽 赫本 逝世查找关于某人逝世相关的信息http://info.pharmacy.hc360.com/2009/03/17125676822.shtml

  http://www.80kuku.com/a/234/87995.html;

  http://www.people.com.cn/digest/200005/10/wy051006.html

  以上多个结果都可以给2分赫本逝世已经很久,关于当时逝世情况、人物历史回顾等内容,都可以给到2分,并不因为有些网页是08年、09年或者10年而导致某个页面认为会比较差。

  迈克尔杰克逊 死讯信息需求http://book.360buy.com/10880231.html

  http://news.163.com/special/00013FR0/MichaelJosephJackson.html

  2个时效性都比较新的专题页面,维护及时,3分

  http://ent.qq.com/zt/2009/mjforever/

  虽然也是专题,但是最新消息都没有,只更新到09年,时效性比较差,但相当完善,2分迈克尔逝世当时的报道,后续已经有了更多的进展,对时效性就有了要求;

  所以内容更新不够及时(时效性差)的页面,需要适当降档打分

  3.5.6 地域需求query

  在某些query下,query没有明确地点,但是根据query描述,知道用户需求具有地域性特点,即只有当地的结果才能更好的满足需求,如天气预报、移动营业厅、团购、餐厅、电影院等。外包评估中根据标注类型,会分为下面两种情况:

  (1)需要考虑地域性

  对于线上搜索效果的评估,如持续评估、监控评估、策略评估等,因为我们评估的结果都来自北京地区,所以评估大致原则如下:

  基本原则是官网4分,符合北京地域需求的结果也4分,其他地域结果1分。如果所求地域与结果的分站地域有上下位关系,比如北京-海淀,那么给2分

  Query需求URL与打分说明

  赶集寻址需求,限定用户所在地是北京http://www.ganji.com/,官网,4分

  http://bj.ganji.com/,

  北京分站,4分

  http://wh.ganji.com/

  武汉分站,1分根据评估类型,看是否需要考虑地域需求

  (2)不需考虑地域性

  对于某些标注类型,不需要考虑地域性需求特点,那么基本原则是官网4分,其他各分站不认为有明显区别,全都统一到3分。

  Query需求URL与打分说明

  赶集寻址需求,并不限定用户是在北京,无地域要求http://www.ganji.com/,官网,4分

  http://bj.ganji.com/,

  北京分站,3分

  http://wh.ganji.com/

  武汉分站,3分根据评估类型,看是否需要考虑地域需求

  3.5.7 纯英文query

  当query是纯英文,给出英文结果页时,不能因为是英文页面就扣分,仍需要按照需求来判断此页面满足情况如何。比如主需求是翻译,则给出全英文的页面不能满足主需求,不好;但比如主需求是介绍,给出英文的介绍页面,也是满足需求的。

  4、特定url页面打分说明

  4.1 百科类结果

  百科结果是评估中大家经常会碰到的页面,这些百科结果往往对于用户是有帮助的,但是在当用户已经了解百科中所介绍的内容、所寻找的是其他方面的信息时,那么对于用户的帮助未必很大,下面举例说明:

  Query需求URL与打分说明

  光合作用介绍需求http://baike.baidu.com/view/8885.htm百科是非常优质丰富的好结果,3分

  e.g.找到e.g.的翻译,是个信息需求http://hi.baidu.com/changcaibai/blog/item/3234319510428b0d7bf48015.html这个类似百科结果,是e.g.的相关介绍等,内容比较优质全面,3分

  银行查找一个银行等http://baike.baidu.com/view/20233.htm介绍需求很低,满足需求会很少,1分

  电子贺卡在线制作、发送电子贺卡http://baike.baidu.com/view/1202827.htm1分,用户主需求是在线进行贺卡操作,而非看介绍

  4.2 搜索结果页

  评估中有时会碰到结果是搜索引擎结果页的,这部分结果应该像普通的页面一样去评估,因为搜索结果页的特殊性,可能这部分结果上不太好评估,所以特别给出这部分的说明。

  4.2.1 什么是搜索结果页

  搜索结果页,除了各个搜索引擎的搜索结果页面外,也包括垂直搜索等范围更小的搜索结果

  (1)普通搜索结果页

  如百度、google等搜索引擎结果页面

  (2)垂直搜索页面-图片搜索结果页

  http://cn.bing.com/images/search?q=%e6%a8%b1%e8%8a%b1&qpvt=%e6%a8%b1%e8%8a%b1&FORM=Z7FD

  (3)垂直搜索-视频搜索结果页

  https://www.google.com.hk/search?tbm=vid&hl=zh-CN&source=hp&biw=1574&bih=938&q=%E8%88%9E%E6%9E%97%E5%A4%A7%E4%BC%9A&gbv=2&oq=%E8%88%9E%E6%9E%97%E5%A4%A7%E4%BC%9A&aq=f&aqi=&aql=&gs_l=video-hp.12...0l0l0l743l0l0l0l0l0l0l0l0ll0l0.

  (4)某些站点的站内搜索结果页

  比如下面的京东商城的搜索结果页,

  http://search.360buy.com/Search?keyword=%B4%F7%B6%FB%B5%E7%C4%D4

  4.2.2 搜索结果页的打分

  如果搜索引擎页实际为空页面,或者实际没有任何搜索结果,那么应该是0分;

  如果搜索引擎页具有一组搜索结果,那么其评分应在0-3分之间,具体根据搜索结果页实际有多少内容对用户需求满足打分。

  注意:对于百度视频、google视频、图片等搜索结果页,不能不查看实际页面需求满足就给出高分。

  下面给出一些具体评估范例参考:

  Query需求URL与打分说明

  北京的必胜客查找北京必胜客地址http://map.baidu.com/?newmap=1&s=con%26wd%3D%E5%BF%85%E8%83%9C%E5%AE%A2%26c%3D131&fr=alaeg&ext=1&from=alamap;

  3分,地图上多家必胜客地址信息,方便丰富地图、地址很类似,地图搜索页往往能够很好的满足地址寻找需求

  http://image.baidu.com/i?tn=baiduimage&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1331708406997_R&pv=&ic=0&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&word=%B1%B1%BE%A9%B1%D8%CA%A4%BF%CD&s=0

  0分Query主需求是地址,某个店的地址大概是1分,某个店的图片更难以满足用户需求,给0分较好

  吸尘器查找吸尘器的相关信息,购买吸尘器http://www.amazon.cn/s/ref=nb_sb_noss_1?__mk_zh_CN=%E4%BA%9A%E9%A9%AC%E9%80%8A%E7%BD%91%E7%AB%99&url=search-alias%3Daps&field-keywords=%E5%90%B8%E5%B0%98%E5%99%A8&x=0&y=0;

  3分,购物网站上的检索信息,方便丰富商品类,各优质b2c网站上的分类页面、检索结果页面只要确实相关,且比较丰富,一般较好

  尼桑骐达新车是否适合上高速信息需求,有疑难求解需求http://www.52che.com/z/guanzhu_364911.html;

  3分,网站骐达类目下的检索信息注意页面上虽然没有很多骐达的字样,但是本身是在骐达论坛下的检索结果,也是符合用户需求的,搜索结果页要特别注意实际结果的满足好坏

  百丽雅文

  百丽雅文女鞋http://www.smarter.com.cn/_lanjmapgnbmfmomemfkonakm-se-ch-1018-c-11/;

  0分,title虽然是百丽雅文,但是实际均是百丽的鞋子,和用户需求不符合检索结果页中,要特别注意有一些结果,是看上去很相关,title和query很匹配的,但是实际上无真正意义上的检索结果,给出一堆其他的信息的,需要给0分

  现在白银的价格具有高时效性要求的某商品价格需求http://www.baidu.com/s?tn=baidurt&rtt=1&wd=%CF%D6%D4%DA%B0%D7%D2%F8%B5%C4%BC%DB%B8%F1;

  1分,检索页面中多个白银相关结果,但也有黄金查询结果,本身并非所有搜索结果都是相关的,且实际多个结果并不能满足用户需求,内容实际没价格搜索结果页,要看相关结果条数、在整体搜索结果中所占的比例,也要考虑实际结果的满足情况如何;例如是不是全都作弊的、看似相关实际不满足的

  4.3 权限页面

  有些网页具有权限限制,即需要注册、登陆该网站后,才能下载或者浏览有用信息。在评估有权限限制的网页时,要根据权限限制强度有多大,进行适当的降档打分。

  权限描述权限限制程度帮助程度

  可以在线浏览全部内容,仅对下载有权限。弱如:百度文库、豆丁网。对用户有较好的帮助,因为浏览即可以满足部分用户的需求。

  不可在线浏览,下载需要登录,是知名网站。较强如新浪爱问、CSDN资料下载。因为是知名网站,所以应该有较多的用户已经有账户。而且注册知名网站的风险较小。所以这类结果对用户有些帮助。

  不可在线浏览,下载需要登录,不是知名网站。强如书香门第网。因为不是知名网站,所以用户已有账号的可能性不大。注册账户的话,有收到垃圾邮件的风险。所以这类结果对用户帮助较小。

  不可在线浏览,下载需要大量积分或付费。很强如中国知网。对这类网站,即使用户注册,也需要付费或者花费大量时间累积积分才能获得所需额的信息,对用户的帮助较小。

  下面举例说明:

  Query需求URL与打分说明

  八年级上学期历史重点总结信息需求。用户想浏览或者下载这一总结资料。http://lishi.ht88.com/downinfo/366553.html;

  1分,不知名网站,强权限,可预览少部分内容,但不足以满足用户需求。尽管网站有权限限制,但内容是相关的,可满足部分愿意注册的用户的需求,因此不可以打0分。

  通讯录管理系统 系统设计浏览或下载这些资料的需求http://www.cnki.com.cn/Article/CJFDTotal-KJXX201011377.htm;

  1分,虽然是大站,但是需要付费,也算强权限知网等虽然是知名大站,但是资料大部分都需要付费,算是强权限

  新视野大学英语三读写教程答案信息需求。用户想浏览或下载这部分教程的答案。

  http://wenku.baidu.com/view/6dffbe23482fb4daa58d4ba0.html;

  2分百度文库结果可以浏览、打印,积分要求比较低,属弱权限,对用户有帮助。

  4.4垃圾、作弊等低质页面

  有些网页在只看搜索结果页中的展现时,或只看tilte时,往往会被认为相关性比较好,但实际页面却往往因为质量低劣而价值很低,或者完全是广告垃圾作弊等页面。这类结果往往视其低质程度,给1或者0分。下面举一些典型例子说明:

  类型Query与url页面打分与说明

  有问无答页面http://wenwen.soso.com/z/q317634928.htm?sp=1510因无答案导致的用户需求难以满足,给0分

  http://wenwen.soso.com/z/q287727880.htm因无答案导致的用户需求难以满足,给0分

  http://www.16k.net.cn/book/88545/8087828.shtml有Title,有正常页面的所属成分,只是完全没有该小说章节的正文,0分

  链接、图片失效,实际无法浏览、下载

  【麻生舞图片】

  http://hi.baidu.com/zhouyh09/blog/item/6f8d55a7636c0a90d043586a.html实际页面上图片已无法观看,对于图片需求来说,该页面完全不能满足,0分;

  【月光传奇补丁】

  http://download.pcpop.com/Down/239080.html#实际下载链接无法点击,因此对于下载需求来说完全不能满足,0分;

  【月光传奇补丁】

  http://down.it168.com/228/231/34314/comment.shtml实际下载链接虽然可以点击,但是全部是死链的,同样给0分

  虚假视频

  【小沈阳】

  http://www.tudou.com/programs/view/UEMWLitg-oE/Title是“小沈阳彪高音”,实际是猫咪吃东西,完全无法满足用户需求,0分;

  【金星舞蹈】

  http://v.ku6.com/show/-V6ssKcVveWdycTNfO8dZA...htmlTitle是“金星老师舞蹈视频”,实际是路边随便乱拍的,无法满足任何需求,0分;

  虚假站点

  【qq2012】

  http://www.up620.com/Title与首屏看上去不错,但首屏后大量不相关链接,点击首屏表面好的链接,一直是广告,始终无法满足用户下载需求,给0分 ;

  低质搜索结果页【虐待凌辱女人】

  http://www.41717.com/game/nuedailingrunvren_838368/搜索结果全都不相关,对于【虐待凌辱女人】来说,0分

  【小学六年级奥数补习班】

  http://cn.coovee.net/3888742/shop.html搜索结果是篮球架、CAD,完全不相关,0分

  文不对题【北京双眼皮医院】

  http://zhidao.baidu.com/question/218643062.html整个页面都没有关于北京医院的推荐;完全没有价值

  【怎么注销qq空间网址】

  http://www.91gupiao.com/info/20110523/345743.htmlTitle看起来相关,实际完全不相关,给0分

  页面不清晰,阅读困难【掌事】

  http://www.yueduge.com/html/8/8484/2054418.html小说阅读页面中,有些是图片格式,其中模糊不清、阅读成本很大的,为低质结果;

  但有些虽然是图片,但是非常清晰,完全不影响阅读的,不算低质,如:

  http://www.uczw.com/html/10/10531/6128806.html

  低质采集,无法阅读【达内培训】

  http://www.17u.net/wd/showguide/1455126内容是从其他网页上直接采集、复制过来的,由于没有排版,非常难以阅读,对于用户来说基本没有帮助,可以直接给0;

  采集的页面要看采集后是否阅读方便,能否满足用户需求,好的采集结果也可以根据需求满足打分。

  广告泛滥http://www.baiwandu.com/Html/Book/39/39610/7783653.html

  http://www.wzyy.org/guochanju/AAzhishenghuo/player.html?14210-0-2

  http://wvw.ranwen.com/html/44/44218/7293048.html广告有普通、悬浮、弹窗等多种,少量不影响阅读的广告不认为很差,但如广告太多影响浏览阅读,或者频繁的弹窗广告,则认为是低质结果,即使能够满足,也只能最高1分;

  内容堆砌、穿插http://www.94mfk.cn/viewnews-14836.html页面完全无排版,且语句完全无法连起来阅读,往往无法满足任何需求,可以直接给0

  http://se.huangse228.com/dde/3574.html网页上有很多“90后mm全裸”的关键字,但是同样无法满足任何需求,直接给0

  http://www.xici.net/d159503568.htm网页上有很多《av电影》的关键字,将原来的正常文章严重打散,直接给0

  乱码页面

  http://launch.groups.yahoo.com/group/dover/messages/24278?xm=1&o=1&m=p&tidx=1

  页面基本乱码,无法满足任何需求,直接给0

  Part6 Query-Url质量评估快速导读

  本部分是对Query-Url评估标准的简要总结,主要介绍评估思路与打分的衡量方法,也希望能帮助大家快速了解本文档。

  1、评估必备软件

  一般评估常用的必备软件,包括以下一些:

  Ø Firefox浏览器、ie浏览器

  Ø 杀毒软件

  Ø adobe flash player、windows media、qvod、百度影音等播放器

  Ø 迅雷、QQ旋风、快车(flashget)等下载软件

  2、评估必备基础知识

  ü Query

  也可称查询词、关键词、搜索词,指用户输入到搜索框想要查找的字、词、符号等。以后作为Query出现的词,都会用“【”、“】”括起来。

  ü Term

  即组成一个query的字、词,如query【新浪微博】,拆开后的“新浪”、“微博”,我们称为Term。

  ü 搜索结果

  指搜索引擎(如百度、google等)根据Query返回的搜索结果,可以指具体某一条,也可以指所有的结果。

  ü URL

  也称为网页地址,简称网址。也就是你将要评估的页面。

  ü 用户需求/用户需求意图

  简称“需求”,用户键入搜索词是希望获得相应的满足,比如获得相应的信息、网上购物等,我们把用户query背后的这种诉求称为用户需求。

  3、query-url质量评估概述

  3.1 什么是query-url质量评估

  Query-URL打分是最重要的一种打分方式,是评价各搜索引擎好坏的基本方式之一。这种评估是根据Query背后的需求,去评价某条结果(即URL页面)对用户需求的满足程度。

  3.2 Query-Url质量评估考虑的维度

  ü 相关性:是指结果主题和用户需求的主题匹配程度,两者说的是不是一回事,有没有跑题。

  ü 需求强度:搜同一个Query,不同用户的需求可能不同。此时,要站在多数用户的角度来判断,越多人查找的需求越重要。主要需求是最多人找的,满足主要需求的结果,是最好的结果;满足冷门需求,则结果差些。

  ü 丰富程度:页面内容越详细越好。

  ü 有效性:能否真正满足,如是否可以真实下载、在线试听等。

  ü 时效性:有些查询,对时间有着较高的要求,期望得到最新的信息。常见的是突发新闻的搜索,哪怕没有明确指定什么新闻,给出最新的内容也是很好的。

  ü 便捷性:找到有用信息要花多少时间和成本。

  ü 权威度:通常出自官方网站、行业知名网站的信息比一般网站要好。

  总结:不同维度适用query范围

  这7个维度在不同特征的query下,关注的重点有不一样,不同维度适用的query范围说明如下:

  维度适用哪些query举例说明

  相关性所有不相关,如丢掉了核心词肯定是0;

  相关,也有可能是0,如软件虚假,视频不能播放。

  需求比例需求有多个需求分析时,重要的是分析主要需求是什么;

  非主要需求,最高只能2分。

  丰富程度需要详细的内容搜作文范文、报告总结、人物资料等,丰富度越高越好,如【实习总结】、【杨幂资料】

  如一句话、数字等简短的内容即可满足,则丰富程度要求不高,如【刘备字什么】、【横看成岭侧成峰的下一句】

  有效性大多为交互操作类query,如下载、视频、试听、文档阅读等,只有资源有效才能满足用户需求的下载,一定要尝试能否下载,是否真实

  如视频,要看内容是否查看,是否真实

  如物流查询,要真能查,才有价值。

  时效性明确或隐含着时间要求的查询近期事件(如地震)、招聘、交易信息等,对时效性要求高;

  高考等周期性事件也有时效性要求;

  中国人口等隐含最新数据的时效性要求;

  便捷性所有用户要找的位于显著位置,第一眼就能看到为便捷性好;当比较难以在页面方便的找到时,即为获取信息满足成本高,会稍差;

  权威度软件下载、商品交易、医疗健康等对权威有要求来自知名网站、专业网站,让人放心。软件下载、医疗健康、银行等,对权威方面的要求高;

  3.3 Query-Url打分分档介绍

  打分类别含义描述

  4(Vital)官方官网权威页面

  3(Useful)很好,对大多数人都非常有用该url页面能满足大多数用户需求,很有价值

  2(Relevant)比较有价值,对部分人较有帮助该url页面对较多或一些用户较有价值

  1(Slightly Relevant)稍沾边,略微有帮助该url页面对大多数用户价值不高,但是跟query相关,少数用户觉得该页面有点帮助

  0(Off-topic OR Useless)不相关或无用资源该url页面毫无价值或价值很低

  死链——死链导致无法被评估的页面

  3.4 Query-Url评估步骤

  整个评估过程可划分为三个步骤:

  ü 需求判断:根据query判断用户需求,确定用户在找什么

  ü 页面质量判断:查看实际url页面,判断结果能否以及多大程度上满足用户需求;

  ü 打分:根据本评估指南,选择合适的分值。

  4、理解用户需求

  打分的第一步是要先理解query含义,弄明白用户搜这个query要找什么。

  要了解query背后的真实需求意图:除了理解query本身的含义之外,您还应该考虑用户输入这个query时,他实际的需求是什么,并以此来给所对应的url页面打分。如【俄罗斯方块】,用户需求很可能是要在线玩这个游戏,也有可能是要下载它。

  4.1 Query需求的主次之分:

  搜索同一个Query,不同人可能有着不同的需求,站在大多数用户的角度来衡量,把握需求主次之分,主次需求会影响打分的高低。

  根据query不同表意下的需求强度,以及同样表意下不同需求维度的需求强度,需求强弱可能有以下几种情况:

  主需求:即输入这个query的用户中,大多数用户心目中的需求。如【windows】,当大多数用户输入这个query时,需求是微软的操作系统,而不是在墙上的玻璃窗户。

  重要需求/次要需求:即输入这个query的用户中,有许多或部分用户存在的需求。如【apple】,水果的需求;【亚马逊】,南美洲亚马逊河流的需求。

  小众/冷门需求:在某些query下,有的表意和需求维度比较冷僻,用户需求的比例非常低。

  泛需求:在某些query下,几乎没有占绝对主导地位的表意或同义表意需求维度上绝对强弱之分,都有一定比例的用户需求,这样情况下根据需求强弱的差别打分,如【长沙】、【书籍】。

  4.2 query需求意图类型:

  根据用户输入query时的需求意图不同,我们将用户需求大致分为3类:寻址需求、信息需求、交互操作需求。

  寻址需求:寻址需求就是指,用户输入这个query,就是为了去这个特定的页面或网站。如【京东商城】、【北京大学】。

  信息需求:用户的需求是获取信息,想了解某信息、某知识,搜索引擎的目标是让用户找到所求信息,给出相关的优质、权威、全面的信息。如:【怎样开车可以省油】、【西夏王陵】

  交互操作需求:用户是要从事某项操作和活动,往往是需要在某个url上,与页面进行一定的交互,从而达到用户的目标、完成相应的操作。比如想下载某款软件、想在网上购买机票,如:【迅雷下载】、【英文翻译】;这类需求很看重结果页面是否进行操作、达成目标。

  Query需求辅助判断:当遇到一个您不熟悉的query,或query的需求很难确定时,您可以参考搜索引擎结果(百度、谷歌)、参考搜索提示或相关搜索、借助百科词条理解。

  需要注意的是:当采用通过搜索引擎来确认用户需求的方法时,千万不要直接将排在前面的结果当做好结果,将排在后面的结果当做差结果。这应当只作为您确认用户需求的方式之一,而非直接根据现有排序情况进行打分。

  5、五档打分标准

  5.1 4分——官方

  Ø 4分结果的基本要求

  Query表意清晰,主需求明确;Url为官方或者首发地址;二者缺一不可。

  Ø 4分的典型情况

  ü 寻址query下,给出官网或指定站内页面;

  ü 实体query下,给出对应实体的官网;

  ü 人名query下,著名人物的官方微博4分;

  ü Url类查询下,仅url查询本身对应url页面可以给4分;

  ü 文章、小说名query下,原创首发可以给4分(报刊发表的,该报网站上该文4分)

  Ø 典型不能有4分结果的情况

  ü Query角度

  没有主需求,需求比较分散;如【DDD】,指代多种实体缩写

  虽有主需求,但非寻址需求,而是信息需求;如【iphone评论】、【北大建校多少年】、【王超英勇事迹】

  ü Url角度

  没有对应的官方网站或网页存在;如【谈南路小学】,这个小学目前没官方网站

  没有任何人或实体可以对应并完全覆盖这个query,如【蘑菇】、【心脏病】

  Ø 典型可有多个4分结果的情况

  ü 多个url对应的实际页面完全相同,例如有无www前缀,index后缀等区别;

  ü 多个url具有相互跳转关系,例如urlA会自动跳转到urlB;

  ü 多个url都可以快捷满足用户需求,例如:下载需求:软件官网首页与下载内页

  5.2 3分——很好,对大多数人都非常有用

  Ø 3分定义

  3分结果,认为应当是在该query下,对于大多数用户都非常有用的好结果。非常有用的3分结果一般应该具备的特征为:符合query需求、页面质量很高。

  注意:一个query,不止一个url页面可以打3分。

  Ø 3分结果特征

  这些页面往往具有以下全部或者部分的典型特征:需求满足程度高、权威性、页面资源真实可用(如可以播放、收听)、页面看起来整洁组织排版很好、页面有用信息容易找到,在时效性需求的query下(如突然爆发的新闻事件),时效性也很好。

  5.3 2分——比较有价值,对部分人较有帮助

  Ø 2分定义

  2分,意味着该页面对于搜索这个query的部分用户是有帮助的。

  Ø 2分结果特征

  可以认为,2分结果对于用户来说,在需求满足方面要稍微差于3分结果,比如丰富全面程度、时效性程度、权威程度(来自不太知名站点)等方面略差;或者只能涵盖query用户需求的一部分,如常见的缺乏明确主需求的query,往往最高只能到2分。

  2分的网页虽然比3分差,但对于用户来说也必须是有价值帮助的,即这个结果对于用户来说,与query主题相关,页面质量不垃圾

  5.4 1分——稍沾边,略微有帮助

  Ø 1分定义

  1分结果可以理解为,页面跟query是相关的,但是对于大多数用户来说这个页面都是没有用的,可能只对少量用户略有价值。“表面看起来相关的差结果”,也会是1分。

  Ø 1分结果特征:

  ü 页面相关,但页面质量较低劣,如页面是打广告目的、采集排版较差等;

  ü 页面相关,但不适合PC端查看浏览,如wap页面

  ü 页面相关,但包含的有用信息很少;

  ü 页面信息因过时、过于具体、过于笼统等而难以达到2分的要求;

  ü 页面信息因满足的需求过于冷僻,而难以达到2分;

  5.5 0分——不相关或无用资源

  Ø 0分定义

  ü 0分代表对于用户来说,这个结果对于搜该query的所有用户完全没有帮助的

  Ø 0分特征

  ü 不相关,即搜A给B,完全不能满足用户需求

  ü 页面无价值,页面即使看起来相关,但实质上页面完全无法提供有价值信息,是一些非常低质页面。如只有链接和广告、虚假视频、虚假站点、有问无答、文不对题、无用内容堆砌等,这些页面较多是作弊的,对用户没有价值。

  5.6 死链

  如页面死链而无法给出打分时,请选择“死链”,死链主要包括以下几种:

  ü 页面抓取不成功,且点击url打开也无法加载,无实际内容的空白页;

  ü 页面报错提示页面:除了报错信息外,页面上没有其他内容;

  ü 标准报错页面:网站直接返回的标准出错页面,如404、500等标准报错代码

  ü 网页恶意软件提示,如“请注意,访问此软件可能会损害您的计算机”;

  6、特定类型打分说明

  Ø 输入错误的query:

  在评估中,我们会遇到一些用户输入错误的query。对于明显输入错误的query,可以根据用户正确需求意图来进行打分,而不是对错误的query进行理解打分;对于非明显输入错误的query,可以根据用户实际输入的query本身来判断用户的需求是什么,从而进行打分。

  Ø url查询query

  即用户想去对应的网站,规范的url查询,如:www.youku.com、360buy.com。不规范的url查询。如:www.mcriosoft.com,query拼错了;wwww.360buy.com多输入了一个’w’。只要确定是找某个url页面,即使输入错误的url,给出对应网站或网页也可以给4分。

  Ø 列表页需求query:

  有些query,用户期望得到很多信息做参考,如:鸡肉食谱、10-15万的suv。Query所需是一个列表时,一个页面上有多个结果往往比单条结果好,一般为页面上多个优质结果>单条优质结果≈普通少量结果>普通单个结果。

  Ø 时效性需求的query:

  有些query,对时效性要求很高,如近期或突发的事件,用户希望看到最新进展。如输入的query是找体育赛事、高考等,一般来说都是想得到最近的相关信息,而不是几年前的信息,除非query明确表明要找过去某个时间的信息。

  Ø 地域性需求query

  定义:有些query具有地域性需求,即当地的结果对于本地用户更能满足需求。如餐馆、电影院等信息,当地信息更好,如【58】,给当地分站较好。

  打分:

  ü 如不知用户所在地, 仅官网可给4分,各地分站结果给3分;

  ü 如已知用户所在地,一般都认为是北京,即官网与北京分站结果都可以给4;外地各分站结果给1分

  Ø 纯英文query

  纯英文query时,给出英文页面不一定就降分,仍然需要根据用户的主次需求来判断页面价值,从而打分。

  Ø 百科结果页面

  百科结果虽然往往质量比较好,但不能直接给予百科结果较高的打分;需要首先判断用户是否具有较强的介绍需求,如百科本身不能满足主需求,最高2分;

  Ø 搜索结果页

  打分:如果搜索引擎页实际为空页面,或者实际没有任何搜索结果,那么应该是0分。如果搜索引擎页具有一组搜索结果,那么其评分应在0-3分之间,具体根据搜索结果页实际有多少内容对用户需求满足打分。

  注意:对于百度视频、google视频、图片等搜索结果页,不能不查看实际需求满足就给出高分。

  Ø 权限结果页面

  有些网页具有权限限制,即需要注册、登陆后,才能下载或者浏览有用信息。打分一般要根据权限限制强度有多大,进行适当的降档打分。

  注意:

  ü 可浏览仅下载有权限的,认为权限弱,浏览下载均具有权限的,认为权限强

  ü 大站点需登录权限,认为权限弱,不知名小站点需登录权限,认为权限强

  ü 仅需注册登录权限,认为权限弱,需大量积分或付费的,认为权限强;

相关内容推荐:

Top