文章摘要

熊回香.全文检索中的汉语自动分词及其歧义处理[J].中国图书馆学报,2005,31(5):0
全文检索中的汉语自动分词及其歧义处理
Automatic Segmentation of Chinese Words and Processing of Their Ambiguities in Full-Text Search
  
DOI:
中文关键词: 全文检索,汉语自动分词,歧义处理,t-信息差,专家系统
英文关键词: Full-text search, Automatic segmentation of Chinese words, Porcessing of ambiguities, Expert system
基金项目:本文是国家社会科学基金项目“基于中文XML文档的全文检索研究”(编号:04CTQ005)的研究成果。
熊回香
华中师范大学信息管理系
摘要点击次数: 3897
全文下载次数: 2110
中文摘要:
      歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
英文摘要:
Processing of ambiguities is the key problem in the automatic segmentation of Chinese words, which is a basic issue in Chinese information retrieval. There are segmentation methods respectively based on dictionaries, statistics, semantics and artificial intelligence. In this paper, the author also introduces various kinds of methods for the processing of ambiguities. 15 refs.
查看全文   查看/发表评论  下载PDF阅读器