Page 86 - 《中国图书馆学报》2010年第4期
P. 86
Han Yi et al. : Research Progress on Methodology Integration of Citation Network Analysis 085
韩摇 毅摇 张克菊摇 金碧辉:引文网络分析的方法整合研究进展
标题词可更好地反映领域发展现状,历史与现 同时考虑了引用关系,而且把引用作为背景信
状的结合能够说明特定领域的发展态势,以此 息来解决语词意义的模糊性问题。 应该说,这
为基础的预测可靠性更好。 我国学者柴省三首 种整合更为彻底,但其效果与机制有待进一步
先引入了这种新的理论和方法 [7] ,并运用该方 探索。
法进行了实证研究 [8] 。 侯跃芳等人利用该方法 3. 1. 3摇 基于引文网络图与主题词关联的微观
探讨“妊娠糖尿病冶领域的发展态势并对该方法 机理探析
的可靠性进行了较为深入的探讨 [9 ~ 10] 。 引文网络图不仅从形式上展示了文献间的
以共引为基础的共词与共引整合虽然开启 引用关系,更多地体现了知识概念的继承与发
了客观文本分析与认知构建分析结合研究的先 展关系。 因此,基于引文网络图来研究主题词
河,但其研究数量较少,研究深度有待进一步拓 的继承发展关系,不仅能够有效探讨科学发展
展,可靠性值得验证,尤其是该方法的机制机理 过程中的微观机理,而且有可能奠定客观文本
等问题有待研究。 分析与认知构建分析整合的理论基础。
3. 1. 2摇 以引用为背景的词—参考文献整合 Jo 等人 [13] 对引文网络图与主题词关联的
一个领域或者专业的研究者一般拥有共同 微观机理进行了初步探索。 他们的研究假设为
的知识基础,对参考文献的选择和利用反映了 引文网络图中联系紧密的文献的主题更相关。
这种共同的知识基础;与此同时,作者在文本内 对于给定的词汇 A,假设 H 表示 A 和主题相
1
容表达过程中选用不同词汇来表达相应主题概 关,假设 H 表示 A 和主题不相关。 观察 A 的词
0
念,这些概念是知识基础的外化。 因此,参考文 汇引用网络图 O(G ) 在假设 H 条件下的概率
A 1
献与作者用词具有整合起来的可能性。 数值,和假设 H 条件下 O(G ) 的概率数值,利
0 A
Besselaar 等人 [11] 和 Heimeriks 等人 [12] 为研 用两个条件概率的差来表示和主题 A 是否相
究领域主题结构的发展演化提出了词—参考文 关,如公式(1)所示。
献共现方法。 研究认为,一个研究领域或者专 Topicscore(A) = log(P(O(G ) | H )) - log
A
1
业可以用包含研究问题和方法的期刊网络和参 P(O(G ) | H )
(P(O(G ) | H )) = log A 1 摇 (1)
考文献的交叉文献集合来定义。 而用于划分知 A 0 P(O(G ) | H )
1 0
识结构的方法无论是共词和共引都存在不足。 作者利用该方法在 Citeseer 和 ArXiv 中进行
共引方法由于受到时滞的影响,反映的是学科 了验证,证明该方法是有效的。 He 等人 [14] 利用
的历史结构;共词由于词的模糊性以及特征表 相应机理探讨了主题词结构的演化发展,并利
示方法的不足,得到的知识结构可能没有实际 用 CiteseerX 数据进行了实证研究。
的意义。 为了弥补这些缺陷,作者提出了把词 吴清强 [15] 也采用了词汇引用图方法来确定
和参考文献进行结合分析的方法。 该方法的主 词汇的主题相关度。 作者给出了相似的检验词
要思想如下:首先把科学领域看作是一个交流 T 的主题相关性方法:假设 H 表示词汇 T 与数
1
网络,利用期刊出版物来描绘该交流系统;进行 据集研究主题相关;假设 H 表示词汇 T 与数据
0
研究时,研究者会同时选择描述研究主题的词 集研究主题不相关。 再假设 H 下的词汇的条
1
和参考具体的文献,参考文献是词具体含义的 件概率为 P(T| H ),假设 H 下词汇的条件概率
1 0
背景信息,有了背景信息的词分析就减少了词 为 P(T| H ),比较两者的大小就可以判断词汇 T
0
本身的模糊性;再把与文献相关的这两个属性 是偏向主题词还是偏向非主题词。 其计算如公
结合起来,共同决定研究专业的细分结构。 作 式(2)所示。
者利用该方法在情报学领域进行了实证分析, PT = P(T| H ) - P(T| H ) (2)
1 0
结果表明知识结构的划分清晰。 两种方法本质上是相同的,只是着眼点有
这种整合方法与前面所述的在共引基础上 所不同,分析目标存在差异。 Jo 的研究是基于
再进行共词分析方法不同,它在分析词关系的 引文网络图来探讨主题词间的相互关系,目标
2010 年 7 月摇 July, 2010

