Page 45 - 《中国图书馆学报》2013年第1期
P. 45
素的类别制订详细的类目映射规则以实现自动映 遵循就宽不就窄的原则,进行包含关系的匹配。
射…;周林志、齐建东等针对 IPC和《中图法》的映 DDC到 C¨C类日匹配中,exactMatch匹配仅占总体
射引入了词汇语义相似度计算方法‘ zl 。 目前对大 类目的25.41%,如表 l 所示,由此可以看出,DDC
规模的词表来说,间接映射和同现映射这两种映射 和 CLC虽然都是综合性分类法,但各学科类目体
的效果非常不理想;人T直接映射的准确度高.但 系之间存在着很大的差异,因此增加了匹配难度。
工作量极大,效率低“ 3] 。 因此如何提高间接映射和 broadMaIch所占比例为46.66%,一定程度 L说明
同现映射的准确性是目前亟待解决的问题。 r DDC揭示学科主题的专深性较 CLC强。
基于此,本文以《杜威十进分类法》( DDC) 和
袭l DDC与 CLC匹配类型比例
《中图法》(CLC)为例,围绕数学、物理、化学、天文、
地理等主要理学类目建立的直接映射基础上.基于
映射数据的语料分析,总结出 DDC和 CLC两个中
外主要词表映射的规律,旨在为两个类表其他范畴
的类目实现间接映射提供参考依据。
2 类表直接映射类型分布
直接映射指直接在不同的受控词表之间建立
语词和分类号的匹配关系,主要依靠智力劳动.人 3 类目映射匹配的依据
工判断类目之间的映射关系。 DDC和 CLC作为对
知识世界进行描述和归类的综合性分类法.以知识 类名、注释和类目间关系是分类法的重要组成
分类、学科分类和概念逻辑为基础,且类分的学科 部分,其共同作用决定类目的内涵和外延.是编目
领域和知识总量基本相同。 但是由于分类原则、分 人员类分文献的主要依据。 同时,由于各国在主题
类深度、分类角度的不同,DDC和 CLC类目的差异 词表和分类法互操作方面取得了显著的成果.当前
性较明显。 因此在映射匹配中,主要涉及的映射类 研究人员分别实现了 DDC与 LCSH( 美国国会标题
型分为三种,exactMatch、broadMatch 、narrowMatch , 、 表) 、CLC和《汉语主题词表》的映射对应,因此类
Cl 表示来源表,C2表示目标表,Cl 与 C2的映射关 目匹配中,各类目对应的主题词将有效地帮助研究
系定义如下: 人员做出进一步判断。 另外,书目记录是专业人员
( 1 ) exactMatch表示等价关系,即 Cl 、C2类目 根据对类目的理解将相关资源归于类表对应类目
表达的概念在内涵和外延上基本相同,由于《中图 下的分类标引结果,所以书目记录同样可作为提高
法》与 DDC分类标准及学科体系的差异,类目等价 映射准确匹配的参考依据。 总体来说,需综合考虑
并不是严格的,允许存在少许的差异。 以上因素来确定类目 C,( CN. ,N. ,Tl,R.) 和 C,
(2) bDoadMatch表示包含关系,即 C2不但表达 (CN: ,N: ,T: ,R。)之间的映射关系,其中 CN表示类
了Cl 所有概念,同时也包含了Cl 类目中没有表达 名,N表示注释,T表示主题词,R表示类目之间的
的概念。 关系。
(3) naf"owMatch表示包含于关系,即 C2类目
只包含了 Cl 类目中的部分概念,与 broadMalch关 3.1 类名
系互逆。 类名是类目名称的简称,作为分类表的主要构
通常情况下,先进行等价关系的语义匹配.如 成,规定了特定类目所表达事物概念的内涵和外
果不符合条件,再进行最近一层向上或向下扩展. 延,是采编人员类分文献的主要参考依据之一。 任