点此下载——冶金工业主题词表词间相关关系的研究
冶金工业主题词表词间相关关系的研究
顾德南
(冶金工业信息标准研究院北京;100730)
摘 要:介绍了《冶金工业主题词表》编制过程中叙词相关关系的种类,提出了相关关系的构建原则,重点分析了相关关系的构建方法及典型案例。得出如下结论:正确理解相关关系的构建原则是建立相关关系的前提条件;对专业知识的准确把握对于建立叙词间相关关系至关重要;建立具有内在联系的相关关系是词表编制的重要目标。
关 键 词:主题词表;叙词;相关关系
0 前言
主题词表(又称叙词表)在知识组织体系建设中的重要作用、《冶金工业主题词表》(以下简称“冶金表”)的编制背景以及等同关系和等级关系的构建在笔者先前的论文中已有论述[1-2]。本文旨在探讨叙词间相关关系的构建,以建立更加完善的、对于文献检索有切实帮助的主题词表。
相关关系,亦称参照关系,是指叙词之间除等同关系、等级关系之外彼此关联的关系[3]。相关叙词之间建立相关参照,可以提高查词效率和扩大检索途径[4]。
相关关系的显示是双向的,所用的参照符号只有一个,用“C(参)”表示相关关系[3]。
1 相关关系的种类
相关关系表现为因果、对立、类似、渗透、属性、原料、对象、手段、方法、应用、设备、工具、整体与部分等多种多样的关系。下文针对“冶金表”中的主题词,列举各种类型的相关关系。
1.1 因果概念之间
炼铁时,如果上下部调剂不匹配,就会造成炉墙结厚。因此,可以建立“上下部调剂”与“炉墙结厚”之间的相关关系。类似的情况还有很多,例如:
上下部调剂 高炉大修 结厚 角裂
C炉墙结厚 C停炉 C洗炉 C漏钢
1.2 对立概念之间 例如:
炉况失常
C炉况顺行
1.3 过程类似的概念之间
例如:
冶炼 钢铁厂 富钛料 烧结
C熔炼 C钢铁工业 C钛精矿 C焙烧
冶金
1.4 相互渗透的学科概念之间
例如:
金属学
C金相学
1.5 事物与其属性概念之间
例如:
冶炼 烧结矿 高炉 蠕墨铸铁
C冶炼参数C转鼓指数C高煤比C蠕化率
冶炼强度
1.6 事物与其原料的概念之间
例如:
炼钢 电解铝
C包芯线 C氧化铝
1.7 学科、理论与研究对象的概念之间
例如:
湿法冶金 粉末冶金
C有色金属 C铁粉
1.8 事物与其研究手段、方法的概念之间
例如:
脱磷铁合金中薄板坯铁水脱硫湿法冶金
C喷吹粉剂C电硅热法C连铸连轧C颗粒镁
C萃取
1.9 事物(学科、理论)与其应用的概念之间
例如:
粉末冶金 富氧熔炼 混联法
C注射成型 C炼铜 C氧化铝
1.10 原理、方法、工艺等与相应设备、工具的概念之间
例如:
炼铜炼铁喷吹连铸坯富氧熔炼闪速炉
C反射炉C高炉C喷枪C结晶器C密闭
鼓风炉C炼铜
1.11 没有建立等级关系的事物整体与部分的概念之间
例如:
热风炉
C蓄热室
1.12 其他相关概念之间
例如:
连铸坯 烧结 冶金 湿法炼锌铸锭
C夹杂物 C返矿C分解C除钴 C偏析
热送热装 燃料分加
2 相关关系的构建原则
迄今为止,相关关系的构建没有权威性的指导原则。笔者认为,相关关系的构建应遵循几个基本原则。
2.1 跨族性原则
F.W.兰开斯特曾提出,同一族系中的词汇间关系完全可以通过等级关系来揭示,不应该也没必要再建立相关关系,否则词表会过于累赘[5]。换言之,相关关系只能建立于不同词族的叙词之间,不妨将这一原则称为跨族性原则。
如图1所示,“冶炼”词族中的叙词只能与“炼钢”词族中的叙词建立相关关系,而不能与本词族中的任何叙词建立相关关系。“富氧吹炼”与“无渣吹炼”建立相关关系是不妥的。

2.2 唯一性原则
戴维民认为,一个叙词一般只应与具有等级关系的两个或多个叙词中的一个建立相关关系[6]。也就是说,一个叙词只能与另一词族中的一个叙词建立相关关系,而不能与另一词族中的多个叙词建立相关关系。如图1所示,如果“炼钢”与“冶炼”建立了互参关系,则不再允许“炼钢”与“二次吹炼”建立互参关系。实际上,唯一性原则与上述的跨族性原则是一致的,因为一旦一个叙词与另一词族中的多个叙词建立了相关关系,那么,另一词族中的多个叙词之间随即存在了相关关系,而此点恰恰违背了跨族性原则。
2.2 适度性原则
建立叙词间的相关关系是为了扩大检索范围,而扩检的程度需要适当,因此,相关关系的建立要适度,不能过于泛滥。一个叙词与数十个叙词建立相关关系显然是不妥的。
3 相关关系的构建方法及典型案例分析
相关关系的建立,不象等同关系和等级关系那样,对错分明。这似乎给相关关系的建立提供了一种相对宽松的条件,但是,正是这种“宽松”条件,增加了相关关系构建的难度。
在手工编制词表的时代,概念之间是否需要建立相关关系完全由编表人员依据自身的知识积累加以联想来确定,具有很大的主观性和局限性。计算机应用于词表编制后,主要通过共现率[7]和相关度量化计算[8-9]等数值,筛选出叙词间可能存在的相关关系,再由领域专家最终确定。虽然在计算机支持下相关关系的构建有了一定的客观依据,但仍然依赖于不同领域专家的个体知识加以判断。所以难免存在仁者见仁、智者见智的问题。
3.1 建立具有内在联系的相关关系
进行文献研究是建立叙词间相关关系的重要方法。例如:就“漏钢率”一词,如果只是将其与“连铸”、“连铸机”等词建立相关关系,意义不大,因为几乎所有关于“漏钢率”的文献无一例外地涉及“连铸”、“连铸机”。“钢包”与“炼钢”也是如此。这种相关关系是基于事物表面的一种相关关系,因此不能起到文献引导和提示的作用。建立“连铸”与“连铸机”、“配料系统”与“配料”这种基于字面的相关关系,更是徒劳。
建立具有内在联系的相关关系,是词表编制过程中应该追求的目标。例如,在为“漏钢率”确定参项时,需要在数据库中用“漏钢率”进行检索,然后浏览相关文献的文摘或正文,得知通过提高结晶器水质、水速,优化结晶器振动参数,保证水口对中等措施,可以降低连铸机漏钢率[10]。因此找出叙词间的内在联系,建立“漏钢率”与“结晶器”和“水口”之间的相关关系。同理,还可通过以上方法建立很多叙词间的相关关系。如表1所示。

3.2 词语级别问题
一个叙词只能与其他词族中的一个叙词建立相关关系,如果这种相关关系具有一定的普遍性,建议针对两个高级别的叙词,甚至是族首词建立相关关系。
如图2所示,喷吹在炼铁过程中具有普遍意义,因此,“炼铁”与“喷吹”互为相关关系,而不是各自的下位词“高炉炼铁”与“高炉喷吹”互为相关关系。但是,如果只有下位概念中的某两个叙词具有相关关系,也不可以将相关关系随意扩大,也就是说,要避免另一种相反的倾向。总之,就是要建立最为紧密的叙词间的相关关系。此类实例很多,如表2所示。


3.3 叙词共现在构建相关关系中的作用
尽管基于文献标题词汇共现获取词间关系不失为一种有效的方法,但共现率并不是绝对的参考因素,即共现率高的不一定是最好的参项,反之,共现率低的未必不可作为参项。例如:关于“保护渣”,有如此文字描述:“连铸生产中,除了浇注断面较小的铸坯外,大都使用保护渣(配合浸入式水口)。实践证明,这一工艺是保证铸坯质量和操作正常的重要条件之一。20世纪70年代初我国把该工艺成功地用于板坯连铸,解决了板坯纵裂问题,随后逐步得到推广应用。”[11]据此,可以建立如表3所示的相关关系,其中有些参项与“保护渣”的共现率并非很高。

4 结论
1)正确理解相关关系的构建原则是建立相关关系的前提条件;
2)对专业知识的准确把握对于建立叙词间相关关系至关重要;
3)建立具有内在联系的相关关系是词表编制的重要目标。
参 考 文 献:
[1] 顾德南.冶金工业主题词表叙词等同关系的研究田.冶金信息导刊,2012(4):67—70,31.
[2] 顾德南.冶金工业主题词表词间等级关系的研究[J].冶金信息导刊,2012(5):54—59,48.
[3] 中国科学技术信息研究所信息资源中心《汉语主题词表》(工程技术版)编制手册(试用版)[M].2010.
[4] GB13190—91语叙词表编制规[S].
[5] 兰开斯特.邢.叙词表词汇组织方法概述[J].桑仁义译.图书与情报,1991(2)149—53.
[6] 戴维民.信息组织[M].北京:高等教育出版社,2009:131—132.
[7] 常春,赖院根.基于文献标题词汇共现获取词间关系研究[J].图书情报工作,2009,53(8):17—20.
[8] 钟茂生,刘慧。刘磊.词汇间语义相关关系量化计算方法[J].中文信息学报,2009,23(2):115—122.
[9] 王红玲,吕强,徐瑞.中文语义相关度计算模型研究[J].计算机工程与应用,2009,45(7):167—170,180.
[10] 李国宏.浅谈如何降低连铸机漏钢率[J].冶金丛刊,2003(5):20—21,32.
[11] 百度百科[OL].http://baike.baidu.com/view/765512.htm[2013—01—25].