Page 85 - 《中国图书馆学报》2013年第1期
P. 85
4.1-2 内容增长规律 括词条编辑。 研究中,假定词条创建时即被编辑 1
在百科系统中,认为词条创建后用户的每一 次。 如果词条编辑次数为 10次,则说明词条被创
次编辑都是有价值的.都为百度百科增加了内容。 建后又被更新修订了9次。 百度百科内容的增长
所以,在百科系统中内容增长既包括词条创建也包 可以用词条编辑次数来表示(见图3)。
图3 词条累积编辑次数
图3中,(a) 图和(b)图分别是 A组与 B组词 被修订过。 图4中,(a) 图和(b) 图分别为 A组、B
条累积编辑次数散点图.(c) 图是两组数据平均后 组词条编辑次数分布图( 两图数轴经过 log2处
得到的词条编辑次数拟合图。 用普莱斯曲线来拟 理) ,可以看出词条编辑次数遵循幂率分布。 综合
合.得到拟合曲线为 F (t) =2072.102e“ ‘‘54 .R2 = 两组数据,词条的平均编辑次数为3.5次,约等于4
0_849.说明百度百科的内容增长基本与文献增长 次。 其中编辑次数为 l 即创建后就再没有被修订
规律相符,也与以往学者对包括维基百科在内的网 过的词条占总量的50.06%,进一步统计,编辑次数
络信息资源增长形式基本相同。 小于4的词条占总量的78.74%。 这些数据说明了
4.1.3 词条编辑次数分布规律 在百度百科中存在着大量不成熟的词条,即没有经
词条编辑次数是词条创建以后被用户修订过 过一定数量用户协作写作的词条,意味着这些词条
的次数.词条编辑次数在一定程度上代表了词条的 的质量很难保证,有进一步吸引用户更新修订的
成熟度,即编辑次数越多的词条往往质量较高‘ -oj。 必要。
本文中,编辑次数为 l 意味着词条创建后就再没有
图4 词条编辑次数