Page 67 - 《中国图书馆学报》2013年第1期
P. 67
“文章被引率”的关注不是很明显,但“985 院校”用
户子群中的诉求比率要高于其他用户群。
然而.常规分类汇总方法尽管能在各口径指标
内部的分析中较好地发挥作用,但在揭示各指标间
的关联关系时却显得相对薄弱。 要对开放存取的
各类用户知识需求之间以及不同用户子群之间做
更深入的关联分析,就必须引人能够更有力地支持
关联分析的数据分析方法。
图 2 “一站式集成”诉求点的用户身份分布
3基于形式概念分析的用户知识需求关联
诉求的用户群依次是:“硕士研究生” 占全部用户 分析
的 47.6% ( 191/401 ) .“本科生” 占 30.4% ( 122/
401 ) .“博士研究生” 占 21.9% (88/401 ) 。 表面 上 3.1 用户知识需求概念格的构建
看.处于学历中间阶段的“硕士研究生”是提出“一 形式概念分析的理论与方法自诞生以来,其在
站式集成(甲3)”诉求的主要用户群。 然而,结合表 关联规则挖掘领域中的优势已被学术界所共识1 81。
1中各用户子群参与调查的用户数量做进一步分 采用形式概念分析方法进行数据分析,首先需将调
析可以发现.在所有被调查的“硕士研究生”中,提 查汇总数据进行形式化处理,构建用户知识需求的
出“一站式集成(T3) ”诉求的占 75.5% ( 191/253)。 形式背景。 研究中仍然采用最初设定的数据筛选
同时.这一指标在“本科生”中为67.4% ( 122/181) , 阈值(25%) .表 l中某一知识需求诉求点如在某一
在“博士研究生”中为90.7% (88/97) 。 这一方面 用户子群中被超过25%的用户提出,则视为该诉求
说明有超过一半的用户提出该项诉求,解释了图 1 点满足阈值要求。 以用户子群为对象,用户知识诉
中“一站式集成(13)”诉求点高居榜首的原因。 另 求点为属性,根据表 1 基础数据构建用户知识需求
一方面,分析结果显示随着被调查用户群学历层次 单值形式背景( 见表2) 。
的提高( 本科生一硕士研究生一博士研究生) ,对 表 2 高校学生用户开放存取知识需求形式背景
开放存取“一站式集成(T3)”的诉求表达越发强
烈。 从这个意义上讲,开放存取的“一站式集成
(T3)” 知 识 诉求点 主要 是 被“博 士 研 究生”
(90.7%)用户子群拉高了比率。 或者可以这样说,
用户的学历层次越高越会追求文献检索的效率。
采用同样的分类汇总思想(基于比率) ,可以
对表 l 中的汇总数据进行更全面的分析。 结果显
示:大多数用户并不关心“低成本或免费”,只有
“一般院校”和“本科生”两个用户子群略显在意;
除部分“博士研究生”外,大多数用户并不在意“发
文时间(新)”:很多用户注重“传统期刊刊载”,且
注:Ul: 一般院校,U2:21l 院校,U3:985院校,U4:博士
在“985院校”和“文史类”用户中表现比较突出,但
研 究 生,U5:硕士研究 生,U6:本科生,U7:文史 类,U8:理
是否为“权威期刊刊载”则少有关注;“985院校”和
工类
“博士研究生”两个用户子群都关注“文章创新
性”,且“理工类”用户要超过“文史类”用户;对于 表2中.一个形式概念是二元组( U,T) ,其中