Page 78 - 《中国图书馆学报》2010年第4期
P. 78
Yang Siluo: The Status and Trends of Web Citation Study Abroad 077
杨思洛:国外网络引文研究的现状及展望
选择的样本中网络引文数太小而不能得出普遍 取中,CiteSeer 和 CiteBase 等较常用。 CiteSeer 由
意义的结论。 Bauer 选取 1985—2000 年 JASIST 美国 NEC 集团公司的研究所创建,该索引基于
刊登的 2000 篇论文作为样本,采用作者同被引 互联网,自动在网上收集各类型的对公众开放
分析法、t 配对检验法,发现 Google Scholar 中的 的计算机科学领域的学术文献,对收集到的文
[52]
引文数量远高于 Scopus 或 Web of Science 。 献进行引文标引,其特点包括:收录的文献使用
[53]
Van 利用 Google 进行网络共引分析,发现它 互联网作为传播媒体;包含代表着学术传播不
能有效地发现科学论文之间的联系。 在最近的 同阶段的文献类型;比 ISI 引文库提供更多的被
[54]
研究中,Kousha 综合多种网络引文数据,提出 引用文献的信息;制作和维护高度自动化;提供
学术成果评价的新指标 IOI(Online Impact Indi鄄 引用文献的全文信息;对论文后的参考文献按
cator)。 其被引次数排序;提供许多 ISI 引文索引所没有
[57]
或根本不可能提供的有价值信息。 Goodrum
4. 2摇 W - P 引文的类型 和 Zhao [58] 都以 CiteSeer 为引文数据获取工具,
网络引文所包含的文献类型多于传统引 分别对不同学科的网络引文情况进行了分析。
文。 2003 年,Vaughan 将网络引文分为 7 类:期 利用搜索引擎获取引文数据,目前主要通
刊(引用期刊的发行者或主办者的网址)、作者 过 Google 和 Google Scholar 获得。 早在 2002 年,
(包括文献作者的通邮地址或网址)、服务(主要 Wilson 就利用搜索引擎,检索一组他本人论文
指文章中列出的文献网络地址)、课程(一门课 的网络引文情况。 Vaughan [50] 使用 Google 提取
程中所开列的阅读书目)、论文(网络文献的正 网络引文,对传统引文和网络引文的异同展开
式参考引文)、会议(会议文献中的被引文献)以 研究。 具体的 Google 网络引文提取方法为:利
及其它 [50] 。 2005 年,Vaughan 使用该分类方法, 用 Google 搜索引擎键入每篇文章的题名,检索
研究生物学、遗传学、医学和跨学科的网络引文 引用情况以及被引次数,并在必要时加入文章
和传统引文 [6] 。 她从学术层面将网络引文分 副标题及作者项检索,以减少误检率和漏检率。
为:淤对研究产生影响的,类似于传统的参考文 还有一些学者采取综合提取方法,如 Kousha 结
献;于其他与智力相关的(课程提纲、学术网站、 合网络引文获取方法和链接提取方法,综合使
学术性的问答系统中提到的参考文献等);盂与 用 Google 和 Google Scholar 及 URL 搜索定位法
智力无关的(表格中、在线书目和作者的个人主 获取 网 络 引 文 数 据, 被 称 之 为 Web/ URL 引
页中提到的参考文献)。 研究发现,30% 的网络 文法 [59] 。
[51]
引文属于第 1 种类型。 2008 年 Vaughan 将网 目前对 W - P 引文的研究也存在许多问题。
络引文分类扩展到 10 类:期刊论文、会议论文、 大部分研究必须依赖于网络引文库或搜索引
图书、技术报告、学位论文、课程论文、课程阅读 擎。 以 Google Scholar 为例,由于商业机密等原
书目、博客文章、在线文章和其它。 基于网络论 因,其收录与检索内在机理还没公开,对人文社
文的 W - W 引文研究中也涉及到引文的分类问 会科学的信息收集不足,而且存在语言方面的
[55]
题,Kousha 将其分为 15 个小类,并合并成 4 偏见;逻辑组配方式也不完全,没有提供截词检
个大类:学术交流目的,非正式交流目的,导航 索;检索结果排序方式单一,仅按论文被引数排
及其他目的;在 2007 年的研究中他又将分类扩 列;系统对检索词的同义词提供不够,检索结果
展到 6 个大类,21 个小类 [56] 。 中“相关文章冶 信息不全等。 另外,由于网络的
开放性和便捷性而易导致恶意点击。 作者可以
4. 3摇 W - P 引文数据的获取 利用网络薄弱的审查机制,大幅度增加自引次
对于 W - P 引文数据,目前必须依赖于引文 数,从而达到提高网络引文数的目的。 另外一
库或搜索引擎间接提取,这些方式在 W - W 引 个问题是如何区分网络引文中的“学术引用冶与
文研究中也普遍使用。 在基于引文库的数据获 “仅仅涉及名称的引用冶。 E. Garfield 在“Impact
2010 年 7 月摇 July, 2010

