Page 103 - 《中国图书馆学报》2013年第1期
P. 103
以上分类体系都是基于学者的经验知识构建 类别‘ l61 :另外 Li等‘ ‘71通过产品和工作两个维度来
的,并非所有学者都同意上述观点,如 Marchionini 理解用户查询意图;Nguyen等l 181 总结出可以从模
等H】 将导航类和事务类归为查找搜索类( lookup 糊性、权威敏感度 、时间敏感度和空间敏感度四个
sea”ch) ;Kang和 Kim[ 1 1 将查询分为话题查询、主页 维度来识别查询意图。 在此 基础之上,Gonzalez
查询和服务查询:Lee等‘51 将事务类和信息类合并 等‘ 一91 认为应从以下维度理解用户的查询意图:信
为一个类别.仅包括研究信息类和导航类;Mendoza 息题材( Genre) 、主题(Topic) 、任务(Task) 、目标
等㈧将查询分为信息类、非信息类和歧义类三类, (0bjective) 、专指度(Specificity) 、范围( Scope) 、权
其中,上文所述的导航类和事务类归为非信息类, 威敏感性(Authority Sensitivity) 、空间敏感性(Spa—
歧义类是指查询既可以是信息类又可以是非信息 tial Sensitivity) 、时间敏感性(Time Sensitivity)。 在
类。 Waller等【11认为搜索引擎除了是获取信息的 这些维度中,学者对时间和空间属性探讨较多,如
接口和到达某网站的通道,也是休闲的场所,故将 Kanhabua等 ‘ a01 将查询时间属性分为时间不敏感型
查询意图分类体系扩展为:信息类、导航类、事务类 和时间敏感型两类:时间不敏感型是指用户在查询
和休闲类.但目前缺乏相关的实证研究。 另一些国 中明确给出时间限定,查询结果不随执行查询时间
内学者‘8—91 指出上述类目体系存在不合理之处,比 的变化而变化.如“2008北京奥运会”;时间敏感型
如建议子类既可能含有查询意图( 例如:如何正确 是指用户在检索表达式中没有给出时间限定词,查
操作使用X光机)也可以是简单的叙述(例如:我 询结果会因为执行查询的时间不同而不同,也可以
建议大家一起去游泳,如何) .并将查询意图划分 认为此查询具有潜在时间意图。 Jones等[21 3 将潜
为:信息寻找意图、询问意图、下载意图、导航/URL 在时间意图查询分为需求最新型、歧义型和非歧义
意图、比较意图和建议意图。 除在文本检索中研究 型三类:最新型是指查找最新信息,非歧义型是指
用户的查询意图类目外,另一些学者也尝试探讨非 有唯一时间限定,歧义型则包含多个潜在的时间属
文本检索中的查询意图类目体系。 如 Lux等0 101 通 性。 空间敏感型查询是指查询应该考虑用户的地
过研究发现,图像检索很少包含意图结构,并且 理位置.针对不同地理位置的用户返回不同的查询
Broder和 Rose提出的分类体系不适合对图片检索 结果.即 Gravano等‘22 3 提出的局域(Local)查询,而
的查询意图进行分类。 基于此,K10ferf11]提出了图 空间不敏感型则无需考虑用户所在具体位置,不论
像检索意图类目体系,主要包含以下四大类:面向 用户在什么地方执行查询均返回同样的结果,即全
知识类( knowledge orientation) 、导航 类( naviga— 局(Global)查询。 Ding等 ‘231 学者进一步将局域查
tion) 、事务类( transaction) 和意识图像类( mental 询细分为三个级别:国家级、州(省)级和城市级。
image)。 Ashkan等【 12l 借助赞助搜索,将用户意图 在文献[24] 中.Jones等学者对查询的地理属性做
分为商业意图和非商业意图;Guo等‘ 13) 又将商业 了更细致的划分。
类查询分为商品了解(Research ) 和商品购买( Pur. 上文介绍了多位学者在查询意图类目划分方
cha8e)两类。 面所做的研究。 虽然每个划分都有 其依据和支持,
以上对查询意图的探讨都是围绕用户查询目 但总体而言.Broder和 Rose等人的类目体系最受
标展开.另外一些学者尝试从其他维度定位用户查 推崇,所以本文的评述也多将围绕这三个类目展
询意图。 最初,有学者尝试基于主题构建查询类 开,并力图兼顾其他方面。
别,并将图书馆学分类体系应用到查询分类中.但
是研究结果表明这种方法适用性不大‘ 14] 。 经过各 2 查询意图的特征识别
阶段的探索.最后建议采用开放式目录(0DP)分类
体系作为主题标签‘ 15】 。 还有一些学者不借助外部 当查询意图类目体系确定后,如何选取分类特
类目体系.直接根据使用的数据集生成相应的主题 征对其进行分类是当前研究的重点。 Spink等‘251