首页 理论教育 地方文献检索概论:查字法及其常用方法

地方文献检索概论:查字法及其常用方法

时间:2023-08-12 理论教育 版权反馈
【摘要】:查字法也称字顺序法,字顺排检法是对文献信息检索工具中款目标识的单字或词组进行排序,以便查检的方法。查字法使用广泛,是工具书的主要编排检索方法,一般字典、词典、百科全书等都采用这种方法,下面介绍几种常用的查字法。1964年,汉字查字法整理工作组提出了《部首查字法》(改革案)。

地方文献检索概论:查字法及其常用方法

查字法也称字顺序法,字顺排检法是对文献信息检索工具中款目标识的单字或词组进行排序,以便查检的方法。通行的查字法有很多种,并不统一,主要有以汉字字形编排的形序法(包括笔画法、笔形法和部首法);按读音编排的音序法(包括韵部法、汉语拼音字母法和注音字母法);将笔形化为代码的号码法(如中国字庋撷法、四角号码法)。

查字法使用广泛,是工具书的主要编排检索方法,一般字典、词典、百科全书等都采用这种方法,下面介绍几种常用的查字法。

1.笔画法

是按照汉字笔画数目的多少来为汉字排序的检字法。汉字笔画少的在前,多的在后,笔画数目相同的,再看起笔笔形,笔画和笔形都一样的,再看字形结构,先左右形体字,次上下形体字,后整体形字,如“崎、崖、圈”三个字,都是11画,起笔笔形都是“丨”笔,但是“崎”是左右结构字在前,“崖”是上下结构字次之,“圈”是整体结构字在后。也有将笔画数相同的字再按部首排列的。检字时,首先计算所查汉字的笔画,然后按照笔画数的多少来查找,笔画数目相同的,再按照每个字的部属或起笔及字形结构区别。

这种方法的优点是简单易学,缺点是由于汉字的笔画比较复杂,简体与繁体、规范体和手写体差别很大,书写习惯又因人而异,因此笔画判断往往会出现误差,而且同笔画的字过多,难以查检。

2.部首法

部首排检法是根据汉字的形体特征,按部首偏旁的相同部分,归类排检文献信息标识的方法,是我国字典、词典最常用的一种编排方法。东汉许慎在所撰《说文解字》中,把9353个汉字按文字形体及偏旁结构分列540部,每部以一个字作为部首,首创了部首编排法。所谓“部首”,是按照字形结构,取其相同部位作为查字依据,分部排列,其相同部位即称“部首”,如“亻”部、“儿”部、“讠”部等。明代梅鹰祚的《字汇》把540部首归并为214部首,《康熙字典》沿用214部首,使之流行开来,称为“康熙字典部首”。20世纪50年代以前的汉语字、词典大部分采用“康熙字典部首”。之后新编的字、词典对部首作了一些调整,《新华字典》和《现代汉语词典》(修订本)都改为189部,还部分地调整了取部首的方法。

1964年,汉字查字法整理工作组提出了《部首查字法》(改革案)。新版《辞海》即采用了新的部首法,采用250部首,对旧部首作了较大改进,力求做到“据形定部”,具体规定是:

(1)一般取字的上、下、左、右、外等部位作部首;这些部位没有部首的,取中坐;中坐没有部首的,取左上角,如“今”归入“人”部,“新”归入“斤”部,“整”归入“束”部。

(2)一个字上、下都有部首的,取上不取下,左右都有部首的,取左不取右;内外都有的,取外不取内;中坐、左上角都有部首的,取中坐不取左上角;下、右、左上角都有部首的,取下、取右、不取左上角。

(3)同一部位有多笔和少笔几种部首互相叠合的,取多笔部首;单笔部首和复笔部首都有的,取复笔部首,如“章”归入“音”部,“吾”归入“口”部。

(4)部首无从采取或所在位置不合规定的,作为“余类”或者设立单笔部首,按汉字起笔笔形归部,如“东”、“飨”归入“余类”或单笔部首“一”、“∠”。

1983年,中国文字改革委员会、国家出版局颁发《汉字统一部首表(草案)》规定部首为201部,确立了汉字部首沿袭“据形定部”的原则。

部首法的优点是能够把结构复杂的大量汉字分别归纳到200个左右的部首里,可以比较准确地按部首检字,不知读音也可查出。因此,语文词典大多采用部首法编排,但是,目前部首法尚未统一,通行的几种部首法部首数量不一,归部原则也不同,同一部首中相同笔画数的字排列方法有别,这都影响查检速度。

3.汉语拼音字母排检法

汉语拼音字母排检法通称汉语拼音法,是依据汉字的读音,按照《汉语拼音方案》字母的顺序编排的查字法。1958年开始推行《汉语拼音方案》以后,随着普通话的推广,汉语拼音法逐步成为工具书的常用编排方法之一。汉语拼音法的排列规则如下:

(1)排列汉字时,先按第一个字母的顺序;第一个字母相同的,按第二个字母的顺序排列;前两个字母都相同的,按第三个字母排列;以下类推,ü排在u后,ch、sh、zh声母和ng韵尾都按单母顺序排列。

(2)声母韵母相同的字按照声调阴平、阳平、上声、去声、轻声的顺序排列。读音(声母、韵母声调)完全相同的,比较汉字的总笔画数,按以少到多排列。如果笔画数相同,按起笔笔形的顺序排列。若起笔至末笔各笔笔形仍相同,则按汉字在国家标准《信息交换用汉字编码字符集》中的编码值由小到大排列。

(3)多音词不问字数多少,按单字的次第,分别排在单字之下,第一字相同的多音词,按第二个字的音序排列次序,依此类推,一些小型词典也有在字头下按多音词字数,从少到多排列的。汉语拼音法的优点是简单易查,但由于以汉字读音作为排序依据,不知读音的字只能用笔画或四角号码索引。(www.xing528.com)

4.四角号码法

四角号码法是根据汉字四个角的笔形确定号码,并按由小到大的顺序排列的查字法,四角号码是单一式的排检方法,不需与其他方法结合使用,排列复词时,第一个字号码相同的,再按第二个字上两角的号码排列,除字典外,查考古籍的字词索引、专名索引等多采用此法编排。

(1)旧四角号码法。“四角号码检字法”从20世纪20年代末开始使用,现通称“旧四角号码法”,基本要点如下:

1)汉字的笔形分为十种,用0—9十个号码代表。十种笔形中1、2、3所代表的横、垂、点三种为单笔,其余均为复笔。取号时,凡能取复笔笔形的,尽量取复笔不取单笔。

2)每个字按左上角、右上角、左下角、右下角的顺序取四个角的号码,如放=0824。

3)字的上部或下部,如只有一单笔或一复笔,无论在什么位置都作左角,右角为0。如室=3010,一个笔形,前角已经用过,后角也作0,如持=5404。

4)外围是“口門鬥行”的四类字,下面两角取里面的笔形。如:因=6043,閉=7724,衡=2143。

5)一个角有两种笔形可取时:有两个单笔或一个复笔时,取左右,不取高低;如非=1111,物=2752,有两个复笔时,取高低,不取左右,如功=1412,盛=5310。

6)撇被下面其他笔形托住时,取其他笔形作下角。如石=1060。

7)附角,四角号码相同的字按附角号码顺序排列。

(2)新四角号码法。1964年汉字查字法整理工作组提出《四角号码查字法(草案)》,通称为“新四角号码法”,新编的字典索引等多有采用。新四角号码法对取角规则作了如下修改:

1)一笔的上下两段和别笔构成两种笔形的,分两角取号,如“大”原为4003,改为4080。

2)外围是“行”的一类字,下两角改按一般规则取号。如“衡”、“衍”均为2122。

3)下角笔形偏在一角的,按实际位置取号,缺角作0。如“弓”原为1720,改为1702。

4)左边起笔的撇,下面为他笔所托,取撇笔作角。如“辟”改为7024。

5)附角改称附号,附号取右下角之上最贴近的笔形,如“工”改为10102。

新四角号码法字形以《印刷通用汉字字形表》的规定为准。

四角号码法的优点是:只要熟悉规则,取号、查检都很迅速,不受部首和读音的限制,但是具体规则较多,不易掌握,新旧号码并行,容易混淆。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈