首页 理论教育 组织机构全称的结构模式优化方案

组织机构全称的结构模式优化方案

时间:2023-07-05 理论教育 版权反馈
【摘要】:组织机构名称简称则是通过一定的缩略规则,对全称进行再加工,形成的更简洁的形式。组织机构名称全称是简称的原型,组织机构名称简称是全称的衍生物。如果将组织机构名称的结构用树形图表示,那么树的根节点即组织机构名称中心词。根据组织机构名称的具体情况,命名时可能出现序数词。多种因素导致了这一类复合组织机构名称的识别效果不够理想。但事件名复合组织机构名称也有自身的特征。

组织机构全称的结构模式优化方案

组织机构名称根据形式可以分为两大类型:全称和简称。全称就是组织机构完整正式的名称。组织机构名称简称则是通过一定的缩略规则,对全称进行再加工,形成的更简洁的形式。如,“北京语言大学”简称“北语”,“上海汽车工业集团总公司”简称“上汽”。组织机构名称全称是简称的原型,组织机构名称简称是全称的衍生物。

根据全称和简称的衍生关系,在结构规则研究中不宜将二者混为一谈,而应该遵照它们的衍生关系进行梳理。本节专门讨论组织机构名称全称的结构规则。

认知语言学认为,语言中的结构映射着我们对世界的认知图景,受制于人类认知时的心理操作程序。组织机构命名也要严格遵循这种认知操作程序,才能保证正常的社会秩序,才能方便交际。

组织机构名称作为一种专有名称,是由语法构词形成的一种复合词,属修饰格式的复合名词。从句法角度看,组织机构名称为“定语+名词性中心语”型名词短语,即定中名词短语(张小衡、王玲玲,1997)。中国人民大学张卫国教授对定中名词短语前面的定语进行了深入细致的考察,把定语分为区别性定语、描写性定语和限定性定语三类(张卫国,1996)。在形式上,限定性定语是黏合式的,这表现在以下几个方面:不用助词“的”直接加在中心词前面;动词、形容词作限定性定语时,不能带虚词,也就是说,只能以非谓语的形式出现;限定性定语与中心词之间,只能插入限定性定语,不能插入区别性和描写性定语(朱德熙,1982)。在意义上,限定性定语是对中心词的限制和认定,在中心词所指的人或事物中限定一个小类。从集合论的观点看,中心词表示一个集合,加上一个限定性定语,就得到这个集合的一个真子集。

组织机构名称中心词前的定语成分属于限定性定语,通过多种词语成分对中心词进行限定,使组织机构名称从中心词逐渐变成具体的专用名称。组织机构名称的命名模式不仅符合认知心理学,也符合语言学的短语结构语法理论和核心推导语法(范晓,1991)。根据短语结构理论和核心推导语法,定中结构短语中,对中心词的语义限定作用越大、越接近短语本质的定语,在词序上越靠近中心词。

如果将组织机构名称的结构用树形图表示,那么树的根节点即组织机构名称中心词。将这个树形结构压缩到线性结构中,成为一个词语序列,形式上就是一个偏正式名词短语或偏正式复合名词,见图5-1。

图5-1 组织机构名称结构树形图

据此,组织机构名称的结构可以抽象表示为X+Y,即组织机构名称由一个或一个以上的限定词(X+)加上表示组织类型的中心词(Y,如“大学”“公司”“医院”“研究所”等)组成。其限定词的次序如下所示:

厂——制造厂——汽车制造厂——第二汽车制造厂——中国第二汽车制造厂

所——研究所——应用语言学研究所——北京语言大学应用语言学研究所

集团——教育集团——安博教育集团——北京师范大学安博教育集团

按照组织机构名称内部嵌套关系,我们可以将组织机构名称分为单一组织机构名称和复合组织机构名称两种。

1.单一组织机构名称

单一组织机构名称即组织机构名称围绕一个中心词形成一层组织结构,结构如下。

单一组织机构名称::=&&{〈地名〉}|序数词|{〈字号〉}|〈内容说明成分〉〈中心词〉

内容说明成分::=&&(产品、对象)(功能/方式/等级)(学科/行业)

〈中心词〉::=&&〈中心词限定词〉〈中心词核心成分〉

组织机构名称中必须出现象征组织类型的中心词。对于有字号的组织,必须出现字号。一般都应出现限定组织所处范围的地名,法律明确规定可以不加地名命名的除外。内容说明成分可能没有,也可能由多个词语序列组成。根据组织机构名称的具体情况,命名时可能出现序数词。举例如下。

①中国政府——〈地名〉〈组织机构名称中心词〉。

②安博教育集团——〈字号〉|〈内容说明成分:行业〉〈组织机构名称中心词:集团〉。

北京第二外国语学院——〈地名〉〈序数词〉〈内容说明成分:学科〉〈组织机构名称中心词:学院〉。

宋庆龄儿童基金会——〈字号:人名〉|〈内容说明成分:对象〉〈组织机构名称中心词:基金会〉。

⑤西安开米股份有限公司——〈地名〉〈字号〉〈中心词限定词:股份+有限〉〈组织机构名称中心词:公司〉。

2.复合组织机构名称

复合组织机构名称即在一个单一组织机构名称前出现一个及以上组织机构名称或事件名等。从形式上看,它是由两个及以上的中心词形成两层及以上的组织结构。后一个单一组织机构名称必须以前一个单一组织机构名称或事件名的存在为前提,它们之间有时间先后、逻辑先后、认知先后、上下级的关系。如北京师范大学安博教育集团、全国人民代表大会常务委员会、清华大学出版社

(1)复合组织机构名称::=&&〈组织机构名称1〉〈组织机构名称2〉……〈组织机构名称n〉。

其中n的值一般为2,有时为3,比3大的数值较罕见。在复合组织机构名称中,组织机构名称1的结构一般都是完整的,而其后的组织机构名称有时是完整的,不过往往只是取单一组织机构名称中的某些部分。举例如下。

①瑞士ABB集团公司中国投资有限公司——〈组织机构名称n〉::=&&〈地名:中国〉〈内容说明成分:投资〉〈中心词:有限公司〉。

山东大学威海分校——〈组织机构名称n〉::=&&〈地名〉〈中心词〉。

③中建三局——〈组织机构名称n〉::=&&〈数词〉〈中心词〉。

④中国海运集团金边分公司——〈组织机构名称n〉::=&&〈字号〉〈中心词〉。

其中,〈组织机构名称n〉::=&&〈内容说明成分〉〈中心词〉,如北京城建集团钢木制品公司、福建医学院营养保健品厂;〈组织机构名称n〉::=&&〈中心词〉,如北京语言大学出版社。

(2)复合组织机构名称::=&&〈事件名〉〈组织机构名称中心词〉。

事件名一般为名词短语,如第二十九届北京奥运会组委会、东航集体返航事故调查组。有时为动词短语,如保持共产党员先进性教育领导小组

事件名结构较灵活,长度较大,成分较复杂,与一般组织机构名称相比,识别难度更大。由于这一类复合组织机构名称数量较少,过去并未受到重视,而且在识别模型训练中面临着严重的数据稀疏问题。多种因素导致了这一类复合组织机构名称的识别效果不够理想。但事件名复合组织机构名称也有自身的特征。(www.xing528.com)

①组织机构名称中心词前一成分为事件类组织机构名称的中心词。如奥运会、运动会、博览会等。

②当组织机构名称中心词为“课题组”“领导小组”“调查组”“检查组”等临时性组织机构名称中心词时,前接成分往往为某一具体事件名的中心词,一般为名词、动名词

根据对识别结果的考察,组织机构名称识别精确率和组织机构名称长度成反比,组织机构名称长度越长,识别错误的可能性越大。复合组织机构名称作为组织机构名称多层嵌套形成的词语形式,词长相对较长,成分相对较多,结构较复杂,所以是组织机构名称识别领域内的难点。

我们建议,不妨对复合组织机构名称分而置之,将登录的组织机构名称作为触发条件,对那些识别字符串中的中心词和词表中的组织机构名称进行逐一匹配。如出现了连续的组织机构名称识别结果,再进行简单的捆绑操作。这样每一个待识别的组织机构名称长度缩短,结构简化,使得组织机构名称识别难度大大降低。这对于提高复合的长串组织机构名称识别精度有很大作用。

现以“南昌市公安局西湖分局筷子巷派出所”为例分析。通过中心词匹配可以初步得到:南昌市公安局/西湖分局/筷子巷派出所;再对每一个单一组织机构名称进行识别:南昌市公安局/ORG西湖分局/ORG筷子巷派出所/ORG;最后增加一条规则:ORG+→ORG。

这种可合可分的处理方式对于组织机构名称观测也有相当大的作用。在组织机构名称考察中,一个组织机构名称及其下属机构的名称是单列的。这样掩盖了上级组织机构名称实际分布的情况。如在我们基于五年六份报纸的组织机构名称知识库里,“中共中央”这个组织机构名称共出现在6312个文本中,累计出现10602次(表5-1)。而以“中共中央”为左边界的组织机构名称就有241种,分布在16949个文本中,累计出现24980次。如果对复合组织机构名称不分段处理,那么在调查“中共中央”这个组织机构名称的分布时,有57.56%的数据就会被掩盖。这样的调查结果显然是不符合实际的。但实行分段处理后,就可以对复合组织机构名称中单一组织机构名称进行进一步的统计,得到切合实际的考察结果。

表5-1 “中共中央”及其复合组织机构名称分布一览

根据对资源库的统计,生产运营类组织机构名称在真实新闻语料中种数比例最大,形式最为复杂,所以下面以生产运营类组织机构名称为例,分析组织机构名称的结构模式。

无论是国际企业还是国内企业,只要在我国经营,都必须遵循我国工商行政管理局的企业命名规定。因此,了解生产运营类组织机构名称的内容说明成分,最好的方式是分析现行企业命名的有关规定。国家工商总局1991年第7号令颁布的《企业名称登记管理规定》第七条规定,企业名称应当冠以企业所在地省(自治区、直辖市)、市(州)、县(市辖区)行政区划名称。下列企业名称可以不冠以企业所在地行政区划名称:①历史悠久、字号驰名的企业;②外商投资企业;③可以申请在企业名称中使用“中国”“中华”或者冠以“国际”字词的下列企业:a.全国性公司;b.国务院或其授权的机关批准的大型进出口企业;c.国务院或其授权的机关批准的大型企业集团;d.国家工商行政管理局规定的其他企业。

由上可知,企业名称应当由以下部分依次组成:

字号(商号)+行业(经营特点)+组织形式。

由此,我们可以将生产运营类组织的结构规则进一步细化:

〈组织机构名称〉::=&&{〈地名〉}〈字号〉〈企业内容说明词〉〈中心词〉

〈地名〉::=&&〈国名〉|〈名词:表地名〉|〈地名〉〈方位词〉|〈处所词〉

〈企业类中心词〉::=&&(中心词限定成分)〈中心词〉

下面我们以使用频率最高的中心词“公司”为例具体分析中心词限定成分。现行《中华人民共和国公司法》(以下简称《公司法》)规定,公司分为有限责任公司和股份有限公司。有限责任公司,必须在公司名称中标明“有限责任公司”或者“有限公司”字样,“责任”一词可省。股份有限公司,必须在公司名称中标明“股份有限公司”或者“股份公司”字样,“有限”可省[1]。

《公司法》中并没有“控股公司”一说。“控股公司”是指通过持有某一公司一定数量的股份,而对该公司进行控制的公司。所以控股公司可以分为控股有限责任公司和控股股份有限公司,即“控股有限公司”和“控股股份有限公司”。

《公司法》中也没有“集团”一说,但在现实经济生活中存在集团公司的概念。“集团”也是一个高频的中心词。集团公司在国家有关规范性文件中均称为企业集团,但在注册时,一般称为某某集团公司。集团公司,是多个公司的联盟,或通过发展多个子公司而形成的大型企业。

根据《公司法》,结合资源库中的公司类组织机构名称,当<中心词>=“公司”,具体限定成分类型如下。

①限定成分缺省。

如:安然公司、欧洲隧道公司、北京金吉列出国留学咨询公司。

②限定成分为一个词。

〈中心词限定成分〉::=&&〈股份|控股|有限|集团〉

白云山股份公司、中国联想控股公司、广发基金管理有限公司、北京铜牛针织集团公司。

③限定成分为两个词。

〈中心词限定成分〉::=&&〈控股有限|股份有限|有限责任|(集团)有限〉

如联想控股有限公司、青岛啤酒股份有限公司、长城证券有限责任公司、中国粮油食品(集团)有限公司。

④限定成分为三个词。

〈中心词限定成分〉::=&&〈控股有限责任|(集团)有限责任|股份有限责任|控股(集团)有限〉

如北汽控股有限责任公司、北京东来顺集团有限责任公司、丹东化学纤维(集团)有限责任公司、北京巴士股份有限责任公司、北京首都开发控股(集团)有限公司。

⑤限定成分为四个词。

〈中心词限定成分〉::=&&〈控股集团有限责任〉

如北京新燕莎控股集团有限责任公司、武汉高科控股集团有限责任公司。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈