Page 86 - 《中国图书馆学报》2013年第1期
P. 86
42 用户贡献行为分析 创建词条数量是指某一用户创建词条的总
参与百度百科词条写作的用户根据其行为性 量,是用户贡献词条的数量特征。 例如某位用户创
质不同可以分为词条创建者与词条编辑者两种.词 建词条数量是20,说明该用户在实验数据中,一共
条创建者即是创建一条系统中不存在词条的用户. 创建了20条词条,尽管不能描述这位用户的所有
词条编辑者是针对已经存在的词条进行修订的用 贡献,但是我们利用抽样的方法以大量数据为基
户。 本研究中将创建者与编辑者行为相分离进行 础,以局部数据可以说明问题。 利用spss软件对用
研究.以发现他们有何不同。 户数量和创建词条数量先进行 2的对数处理.再绘
4.2.1 用户创建词条数量分布规律 制散点图(见图5) 。
图5 词条创建者分布
由图5看出,用户创建词条数遵循幂率分布。 编辑次数是指某一用户编辑词条次数的总
进一步统计发现所有创建者平均创建词条数量为 和,是用户贡献度的重要数量特征。 例如某一用户
2.2.其中 2.37%的用户创建了占总量 34.9%的词 编辑词条次数为 20.是指在实验数据中用户总共
条,87.9%的用户创建词条数量低于平均数,充分 更新修订词条次数为20。 图6为 A组 、B组用户编
说明了百度百科用户创建词条行为的集中和分散 辑次数分布图(两图数轴经过 log2处理) ,可以看
趋势,即少量的用户集中贡献了大量的内容,大量 出词条编辑次数与用户创建词条数量相同都遵循
分散的用户贡献率较低。 幂率分布,所不同的只是倾斜度和系数。 经过统计
4.2.2 用户编辑次数分布规律
图6 词条编辑者分布