Page 115 - 《中国图书馆学报》2013年第1期
P. 115

1/53的科研资助方( n =53) 给出了对数据使用行
                   在线科学数据
          ·许 多学 科领域相互交 叉.使用 来自                    为的要求或建议【 10I。
           其他学科的数据
                                                      建立一种统一的、严谨的、规范化的数据引证
          ·网络 可以 整合所有 文 献 与 数 据资源
                                                  格式,对后续的基于数据引证行为与记录的分析至
          ·阅读 时 可以从研 究的 文本描述部分 ,                  关重要。 在这之前,一些关键性的问题需要得到解
           方便跳转到 计算过程,再跳转到
           数据 ,再 回到 文本部分                          决,例如:数据著作权与所有权的界定、数据保存与
          ·信息 对于任何地点 的任何人都                        可持续性维护、数据特征描述的指导规范、数据集
           触手 可及
                                                  标识系统的建立 、科学记录中引用数据的规范、数
          ·提 升科学 信息的流通速度
                                                  据集与文献之间的有效链接等。 国际上众多致力
          ·极大地提高科学生 产力
                                                  于“数据引证”相关研究的组织与研讨小组( 见表
                     图l 科学研究的素材
                                                  l 、表2) ,已经在某些问题上取得了重要进展。 正
             (来源:The FourIh Paradligm:Data.intensive Scientific
                                                  如 Joseph A.HourcI6总结的那样0 1 1 】:“我们现在已
          Discovery.Microsont Resrarch ,2009)
                                                  经有了一些用于指导数据引证巾应当标明哪些属
          利用的效率与收益、加快科学发现与创新的步伐.                  性的规范、对不同的标识系统( identifier system) 的
          这也是信息计量学与科学计量学的宗旨所在。 Jim                分析、通过 EZID生成价格合理的 D0l( Digita1 0b.
          Gray在 NRC —CSTB的演讲报告i 31 中,呼吁联合所        jecI Identifier) 、OAI 一 0RE( 0pen Afchives Initiative
          有的科学数据与文献形成一个互操作的世界:读者                  一0bject Reuse and Exchange.开放存取先导计划之
          在阅读文献的时候,可以访问论文的原始数据甚至                  数字对象再利用和交换计划)以及用于描述合集与
          重复研究的过程,或者能够从数据开始找到与之相                  替代集(aggregates and aIternatives) 的元链接( Met.
          关的所有文献。 这种数据与文献的互操作可以提                  alink) ,我们现在已经具备了建立数据引证框架体
          升“信息速度”(information velocily) .从而提高科学   系所必需的构成元素。”
          生产力。 显然,数据引证的规范化,以及对数据与
          引证文献之间关系的研究,是实现这种诱人设想的                  4亟待研究的若干问题
          第一步。
                                                     就目前来说,规范的数据引证还未得到广泛的
          3数据引证的研究现状                              实践,也还未在科学出版中被正式要求,但是这种
                                                  趋势是显而易见的。 对数据引证行为与记录的知
              数据引证规范化的重要性,早在几十年前就                 识计量研究,亟待推进。 相比等一切条件都完善时
          被认识到,然而当前的状况却不尽如人意。 一项发                 才采取行动,未雨绸缪是更佳的选择。 其中.以下
          表于 2000—2010年间、覆盖6种期刊500篇文献的            几个问题亟待解决:
          研究显示o 'o】 ,数据引证行为在学界中实际上是严                 (1 )数据引证现状评估与研究进展的追踪
          重缺乏的:198篇涉及数据再利用的文献中.只有                    在西方国家已经有了一些针对数据引证行为
          14%的文献在他们所使用的数据集中标出了数据                  的调查研究‘ 10.12—13] ,这些调查结果为掌握数据引
          集的唯一标识;只有 12%的文献( 当中存在部分重               证实践及相关政策的现状提供了切实的证据.暴露
          叠) ,提到了数据集作者和数据存储地的名称:很少                出现存的问题并引起了必要的关注。 但在中国.目
          有文章将其对数据集的引用纳入正文后的参考来                   前还没有发现有关“数据引证”的调查性研究.相
          源部分。 与此同时,也鲜有政策涉及推荐或要求采                 关的理论性探讨也很鲜见。 中国的科学记录格式
          纳正确的规范化的数据引证方式:估计只有三分之                  与西方国家存在着一定的差异,并具有自身独特的
          一的数据存储机构(n=26) ,6%的期刊(n=307) .          特点。 因此,国内学者们应该对此给予足够重视.
   110   111   112   113   114   115   116   117   118   119   120