沈志宏,刘筱敏,郭学兵,张晓林,黎建辉.关联数据发布流程与关键问题研究——以科技文献、科学数据发布为例[J].中国图书馆学报,2013,39(2):53~62
A Research on Publishing Workflow and Key Issues of Linked Data: Experience with Publishing Scientific Literature and Scientific Data as Linked Data
关联数据发布流程与关键问题研究——以科技文献、科学数据发布为例
  
DOI:
Key words:Linked data,Linking open data,Data publishing,Scientific literature,Scientific data,D2R server
中文关键词:  关联数据,关联开放数据,数据发布,科技文献,科学数据,D2R Server
基金项目:本文系中国科学院信息化专项“科技数据资源整合与共享工程”(XXH12504)和国家科技基础条件平台建设项目“基础科学数据共享网—理化天文空间生物”课题“标准规范及共享服务平台建设”(BSDN2009-17)的研究成果之一。
Author NameAffiliation
Shen Zhihong 中国科学院计算机网络信息中心 北京 100190 
Liu Xiaomin 中国科学院国家科学图书馆 北京 100190 
Guo Xuebing 中国科学院地理科学与资源研究所 北京 100101 
Zhang Xiaolin 中国科学院国家科学图书馆 北京 100190 
Li Jianhui 中国科学院计算机网络信息中心 北京 100190 
Hits: 4747
Download times: 2743
Abstract:
Combined with the publication of linked data in Chinese Science Citation Database (CSCD) and the flux data in Chinese Ecosystem Research Network (CERN), this paper studies the standardized publishing workflow of linked data and key issues in such process by studying on the technical framework of publishing linked data with examples. The standardized publishing workflow of linked data consists of such six critical steps as data modeling, entity naming, turning entity into RDF, make connections between entities, entity publication and open type inquiry. Some key issues need to be considered in the publishing process, such as dealing with multilingual values, publishing value vocabularies and publishing RDF vocabularies. In addition, this paper gives some suggestions in case D2R Server is used to publish linked data: not using blank note; trying the best to make pre design of relational database better; specifying the data type of non text attributes; splitting and combining table entities properly. 5 figs. 3 tabs. 31 refs.
中文摘要:
      本文结合中国科学引文数据库和中国生态系统研究网络通量数据的关联数据发布,以关联数据的发布技术框架为研究对象,采取实例阐释的方法,提出了关联数据发布过程中可参考的标准化流程,并详细分析了其中的关键问题。研究表明,关联数据发布流程可以分解成数据建模、实体命名、实体RDF化、实体关联化、实体发布、开放查询六个关键步骤,发布过程中需要考虑到多语种问题、值词表的发布、RDF词表的发布等关键问题。关于利用D2R Server发布数据,本文建议:不要采用空白节点;尽量做好关系型数据库的前期设计;指定非文本属性的数据类型;适当进行实体表的拆分与合并。图5。表3。参考文献31。
View Full Text   View/Add Comment  Download reader