Page 78 - 《中国图书馆学报》2010年第4期
P. 78

Yang Siluo: The Status and Trends of Web Citation Study Abroad 077
                                                杨思洛:国外网络引文研究的现状及展望


   选择的样本中网络引文数太小而不能得出普遍                    取中,CiteSeer 和 CiteBase 等较常用。 CiteSeer 由
   意义的结论。 Bauer 选取 1985—2000 年 JASIST      美国 NEC 集团公司的研究所创建,该索引基于
   刊登的 2000 篇论文作为样本,采用作者同被引                互联网,自动在网上收集各类型的对公众开放
   分析法、t 配对检验法,发现 Google Scholar 中的        的计算机科学领域的学术文献,对收集到的文
                                    [52]
   引文数量远高于 Scopus 或 Web of Science     。   献进行引文标引,其特点包括:收录的文献使用
      [53]
   Van  利用 Google 进行网络共引分析,发现它             互联网作为传播媒体;包含代表着学术传播不
   能有效地发现科学论文之间的联系。 在最近的                   同阶段的文献类型;比 ISI 引文库提供更多的被
              [54]
   研究中,Kousha    综合多种网络引文数据,提出             引用文献的信息;制作和维护高度自动化;提供
   学术成果评价的新指标 IOI(Online Impact Indi鄄      引用文献的全文信息;对论文后的参考文献按
   cator)。                                 其被引次数排序;提供许多 ISI 引文索引所没有
                                                                             [57]
                                           或根本不可能提供的有价值信息。 Goodrum
   4. 2摇 W - P 引文的类型                       和 Zhao  [58]  都以 CiteSeer 为引文数据获取工具,
       网络引文所包含的文献类型多于传统引                   分别对不同学科的网络引文情况进行了分析。
   文。 2003 年,Vaughan 将网络引文分为 7 类:期            利用搜索引擎获取引文数据,目前主要通
   刊(引用期刊的发行者或主办者的网址)、作者                   过 Google 和 Google Scholar 获得。 早在 2002 年,
   (包括文献作者的通邮地址或网址)、服务(主要                  Wilson 就利用搜索引擎,检索一组他本人论文
   指文章中列出的文献网络地址)、课程(一门课                   的网络引文情况。 Vaughan     [50]  使用 Google 提取
   程中所开列的阅读书目)、论文(网络文献的正                   网络引文,对传统引文和网络引文的异同展开
   式参考引文)、会议(会议文献中的被引文献)以                  研究。 具体的 Google 网络引文提取方法为:利
   及其它  [50] 。 2005 年,Vaughan 使用该分类方法,     用 Google 搜索引擎键入每篇文章的题名,检索
   研究生物学、遗传学、医学和跨学科的网络引文                   引用情况以及被引次数,并在必要时加入文章
   和传统引文    [6]  。 她从学术层面将网络引文分            副标题及作者项检索,以减少误检率和漏检率。
   为:淤对研究产生影响的,类似于传统的参考文                   还有一些学者采取综合提取方法,如 Kousha 结

   献;于其他与智力相关的(课程提纲、学术网站、                  合网络引文获取方法和链接提取方法,综合使
   学术性的问答系统中提到的参考文献等);盂与                   用 Google 和 Google Scholar 及 URL 搜索定位法
   智力无关的(表格中、在线书目和作者的个人主                   获取 网 络 引 文 数 据, 被 称 之 为 Web/ URL 引
   页中提到的参考文献)。 研究发现,30% 的网络                文法 [59] 。
                                  [51]
   引文属于第 1 种类型。 2008 年 Vaughan      将网        目前对 W - P 引文的研究也存在许多问题。
   络引文分类扩展到 10 类:期刊论文、会议论文、                大部分研究必须依赖于网络引文库或搜索引
   图书、技术报告、学位论文、课程论文、课程阅读                  擎。 以 Google Scholar 为例,由于商业机密等原
   书目、博客文章、在线文章和其它。 基于网络论                  因,其收录与检索内在机理还没公开,对人文社
   文的 W - W 引文研究中也涉及到引文的分类问                会科学的信息收集不足,而且存在语言方面的
           [55]
   题,Kousha  将其分为 15 个小类,并合并成 4            偏见;逻辑组配方式也不完全,没有提供截词检
   个大类:学术交流目的,非正式交流目的,导航                   索;检索结果排序方式单一,仅按论文被引数排
   及其他目的;在 2007 年的研究中他又将分类扩                列;系统对检索词的同义词提供不够,检索结果
   展到 6 个大类,21 个小类    [56]  。              中“相关文章冶 信息不全等。 另外,由于网络的
                                           开放性和便捷性而易导致恶意点击。 作者可以
   4. 3摇 W - P 引文数据的获取                     利用网络薄弱的审查机制,大幅度增加自引次
       对于 W - P 引文数据,目前必须依赖于引文             数,从而达到提高网络引文数的目的。 另外一
   库或搜索引擎间接提取,这些方式在 W - W 引                个问题是如何区分网络引文中的“学术引用冶与
   文研究中也普遍使用。 在基于引文库的数据获                   “仅仅涉及名称的引用冶。 E. Garfield 在“Impact

                                                              2010 年 7 月摇 July, 2010
   73   74   75   76   77   78   79   80   81   82   83