张智雄,张晓林,刘建华,邹益民,谢靖,钱力,王颖.网络科技信息结构化监测的思路和技术方法实现[J].中国图书馆学报,2014,40(4):4~15
The Ideas and Methods of Structural Monitoring of the Scientific and Technical Information Resources on the Web
网络科技信息结构化监测的思路和技术方法实现
Received:September 28, 2013  Revised:December 14, 2013
DOI:10.13530/j.cnki.jlis.140012
Key words:S&T web information  Structural monitoring  Monitored content object  Knowledge extraction  Automatic monitoring system  Field monitoring
中文关键词:  网络科技信息  结构化监测  内容监测对象  知识抽取  自动监测系统  领域监测
基金项目:本文系国家自然科学基金项目“基于语言网络的文本主题中心度计算方法研究”(批准号:61075047)及中国科学院文献情报能力建设专项项目“网络科技信息自动监测系统二期建设”(编号:院1306)的研究成果之一
Author NameAffiliationE-mail
Zhang Zhixiong 中国科学院文献情报中心,北京 北京 100190 zhangzhx@mail.las.ac.cn 
Zhang Xiaolin 中国科学院文献情报中心,北京 北京 100190  
Liu Jianhua 中国科学院文献情报中心,北京 北京 100190  
Zou Yimin 中国科学院文献情报中心,北京 北京 100190  
Xie Jing 中国科学院文献情报中心,北京 北京 100190  
Qian Li 中国科学院文献情报中心,北京 北京 100190  
Wang Ying 中国科学院文献情报中心,北京 北京 100190  
Hits: 4668
Download times: 1758
Abstract:
Due to its openness and timeliness, S&T web information has become one of the most important resources for strategic intelligence monitoring. However, since S&T web information is unstructured and lack of semantic description, it is a challenge to transfer the unstructured web information into structured semantic knowledge. To solve this problem, the authors propose a method for structural monitoring of the S&T web information resources. By using the knowledge extraction technology, the authors firstly extract the knowledge objects as well as the relationship between objects from the web resources and convert the free text into calculable structured knowledge unit. Based on those extracted structured information, the authors build various kinds of monitor models to realize research profiling for specific research field. Based on those ideas, the authors implemente the automated web information monitoring system suitable for research field monitoring. A research profiling experiment also is carried out based on the semantic resources which are converted from the monitored web data. 6figs. 1tab. 16refs.
中文摘要:
      网络科技信息具有开源、发布及时等特点,目前已成为战略情报监测的重要资源。但这类资源又具有非结构化、无语义描述等特点,如何将Web信息从非结构的自由信息转为可分析的结构化、语义化信息成为一个亟需解决的问题。针对这一问题,笔者提出了网络科技信息结构化监测的思路方法。这一方法通过知识抽取技术,从网络信息资源中抽取出嵌在其中的知识对象以及对象间的相互关系,将自由文本转换为结构化的可计算的知识单元,在此基础上构建各类监测模型,进而实现对研究领域的态势监测。基于这一思路,笔者开发了“网络科技信息自动监测系统”,并基于监测数据所形成的语义资源,进行了监测态势分析实验。图 6。表1。参考文献16。
View Full Text   View/Add Comment  Download reader