“非常”“特别”和“相当”
语料库获得数据来观察近义词在使用方法上的区别从而发现它们的使用规律是一种有效方法。本文利用报纸语料库和有声媒体部分语料库,并通过自建玄幻小说语料库,对“非常”“特别”和“相当”进行了定量考察,研究了各个词内部自身功能的使用概率、相同用法在语域上的分布以及作近义词时相互之间的互换能力。
标签:语料库 非常 特别 相当 数据 用法
一、引言
“非常”“特别”和“相当”在汉语中是一组近义词。《现代汉语词典》(第5版)(以下简称《现汉》)给出的三个词的词性、意义及例句如下(文字格式稍有变动):
【非常】fēi chánɡ [形]属性词。异乎寻常的;特殊的:~时期|~会议。[副]十分;极:~光荣|~高兴|~努力|他~会说话。
【特别】tè bié [形]与众不同;不普通:~的式样|他的脾气很~。[副]格外:火车跑得~
快|这个节目~吸引观众。[副]特地:散会的时候,厂长~把他留下来研究技术上的问题。[副]尤其:他喜欢郊游,~是骑自行车郊游。
【相当】xiānɡ dānɡ [动](数量、价值、条件、情形等)两方面差不多;配得上或能够相抵:旗鼓~|年纪~|拦河大坝高达一百一十米,~于二十八层的大楼。 [形]适宜;合适:这个工作还没有到~的人|他一时想不出~的字眼来。[副]表示程度高,但不到“很”的程度:这个任务是~艰巨的|这出戏演得~成功。
现在我们要问,这三个词各自的词性使用均衡吗?作近义词表程度的语法概率如何?它们在不同语域中表现一样吗?三个词能自由互换吗?显然依靠词典无法回答这些问题。
M.A.K.Halliday(2007:63)认为,“对把语料库研究作为一种语言之语法的信息资源、事实上作为洞察语法各个方面特性的资源是非常重要的一点,我们如今已无需进行争论。”潘永樑(2004)指出,“重新肯定以实证和统计资料为基础的研究方法,是语言学领域的一个重要进展。”对许多应用而言,语料库的数据是自然语言处理的原燃料,并且/亦或是评估一项自然语言处理应用优劣的检测平台。(Tony McEnery,2003)那么,我们可否利用这个平台来研究近义词的用法呢?“同义词之间划等号是非常具有误导性的,因为它们实质上是以不
同方式在使用。基于语料库的词汇分析能够特别合适地揭示使用模式中的系统差别。”(Douglas Biber etc.,1998:43)因此,我们想求得“非常”“特别”和“相当”的用法正解,最直接的莫过于去语料库中寻求数据,对数据进行分析,观察三个词语的用法,最终发现各自的用法特点。
二、方法
(一)语料库的选取和构建
我们使用的三个语料库分别为:1.2009年五大主流报纸:《人民日报》《光明日报》《中国青年报》《新民晚报》和《北京青年报》,共计174,871个文件,约131,020,802汉字,以下简称“报纸语料库”;2.从网络上选取了13篇点击率比较高的玄幻小说构建的语料库,共22,000,062KB,约13,160,422字,以下简称“小说语料库”;3.利用中国传媒大学有声媒体语料库中的中央电视台栏目《心理访谈》2007年3月2号到2007年12月28号时段内的129篇文章,组成一个广播电视谈话体语料库,字数大约为2,047,182字,以下简称“有声语料库”。
对这三种语料库的选取,主要考虑的是语体特征。报纸语料库代表了正规的书面语体;而有声语料库则代表了比较通俗的口语语体。玄幻小说是当今活跃于通俗文学领域的四大金刚之一(马睿,2008)。郑振铎(1954)认为俗文学即是通俗文学,所谓俗文学即“通俗的文学,民间的文学,也就是大众的文学”(转引自王琳,2008)。范伯、孔庆东(2003:16)在谈到通俗文学时说,“如要评估某篇(部)作品是否是通俗文学,不外乎从三方面加以考察,即:一、是否与世俗沟通;二、是否浅显易懂;三、是否有娱乐消遣功能。”他们指出,在作品的语言表达上,也要求作家以俗语道俗情;通俗文学就要做到“明白晓畅,语语家常”。但是,玄幻小说又具有书面语的特。它虽然有自身的一些特征,如迎合大众趣味、追求娱乐化,但文学的根本标准是不能丢弃的(武善增,2008)。因此,玄幻小说的语言既不像口语那样随意,也不像报刊的书面语那样正规,体裁介于书面语体和口语语体之间。我们进一步对13篇小说进行了检索发现,出现“说道”23,457次。对其中一篇小说分词后词频排序,“说道”紧紧排在“的”“了”“你”“我”“也”“是”和一个人名(主人公)之后的第8位。这说明在玄幻小说中对白很多。另外,报纸语料库字种数是8,223,有声语料库的字种数是3,345,而小说语料库的字种数是5,220。这也说明我们选择玄幻小说作为中间语体语料库是合理的。
(二)数据提取
在选择和建立语料库后,我们使用中国传媒大学的生语料库检索系统软件RCRS,分别对“非常”“特别”和“相当”进行检索并对检索结果进行了存储,为下一步分析做好了准备。我们进一步使用分词与标注软件BST对获取的初始检索结果进行分词标注,并将结果文件另存,再使用分析软件antconc3.2.1w对语料进行检索,获取相关数据。
三、结果
(一)粗略统计
从报纸语料库中我们共提取到“非常”词条30,606个,关键词左右两侧字数各限定为10,然后将结果储存。提取到“特别”词条共计34,729个,并将左右字数限定为10,将结果予以存储。提取到“相当”词条共计10,874个,也将左右字数限定为10,并将结果存储。
采用同样的方法,从小说语料库和有声语料库中对三个词条进行提取并储存。
(二)作副词、程度副词的使用统计
我们先用BST软件进行分词标注,区别词标注为b;副词标注为d;动词标为v。这里需要说明的是,将《现汉》中表属性的形容词视为区别词对我们统计副词没有影响。标注结束后我们看到:“非常”与“特别”的标注正好和《现汉》相同,各有两种用法;而“相当”只标注了两种用法,一种是动词,另一种作副词,这点与《现汉》不同。因为“相当”的形容词用法是后接“的+名词”,我们观察到“相当”作形容词用时该软件也将其标注为动词,这对我们对作副词的统计也没有影响。
运用软件进一步检索出各个词用作副词时的数据。在报纸语料库中,“非常”作副词是29,179,“特别”作副词是30,618,而“相当”作副词是7,270;在小说语料库中,“非常”作副词是1,780,“特别”作副词是668,而“相当”作副词是1,306;在有生语料库中,“非常” 作副词是1,047,“特别”作副词是1,753,而“相当”作副词是95。
程度副词的用法是三个词作为同义词的根本所在。作程度副词时它们都后接形容词,或者后接“的+形容词”的结构。因此我们对这两种情况进行统计,连同上述数据填入下表。
表1:总频次和作副词、程度副词的频次统计
(三)右边界共现词语统计
我们用分析软件antconc3.2.1w对三个词的右边界共现词语按照频次、不分词性地进行排序,并将结果记入下表(不分词性是为了更好地观察各自词性的用法概率)。
表2:三个词语的高频右边界共现词语表
四、分析讨论
(一)各个词的副词功能分析
表3:各个词用作副词、程度副词的概率分布表非常的同义词
从表3可知,“非常”的用法基本上以副词为主,在报纸语料库和小说语料库中作副词的比例都在95%以上。在有声语料库中,比例也高达87%。副词的用法之中后接形容词及后接“的+形容词”的程度副词语法占主导地位,分别是70%、84%和92%。程度副词的总体用法比较均衡。“非常”作区别词使用也有很多讨论,如于全有(2000)、邓玲(2003)、刘琍(2004)、龚俊贞(2008)、张谊生(2008)等从不同角度讨论了这一语言现象,看法不一。从比例来看,这一用法不是高频用法,常出现在一些电影电视节目片头名上,如“非常6+1”“非常岳母”等等。
“特别”作副词比例变化也很大,报纸语料库中为88%,小说语料库中是67%,而在有声语料库中占76%。从比例判断,“特别”的主要功能仍是作副词。但值得注意的是,从典型的程度副词用法上看,报纸语料库中只占副词总用法的18%,占这个词的用法的16%。小说语料库中,典型程度副词用法占副词用法的43%,占总用法的29%。而在有声语料库中,占副词用法的比例升高到77%,占总用法的58%。因此,“特别”的用法极为不均衡,但整体上副词用法还是主要用法。我们可以推算出作形容词的比例:1–(88%+67%+76%)/3=23%。总之,“特别”要比“非常”用法多,作典型程度副词的比例小。关于“特别”,可参见黄誉娇(2009)、朱华、曾昭聪(2010)。
“相当”的使用在分布上和“非常”“特别”都不同。报纸、小说、有声语料库中副词用法各占67%、87%和73%;后接形容词作程度副词占副词用法的比例分别是69%、99%、78%;占词语总用法的比例分别是46%、86%和56%。观察可知,“相当”作程度副词是副词用法中的主要用法,副词用法也是总用法中的主要用法。作副词用法虽然出现较晚,现当代却快速发展并超过了作动词、形容词的用法(曹秀玲,2008)。具体用法请参看王业奇(2006)、单宝顺(2009)、赵文源(2009)。“相当”作动词具有模糊比较的意味,所以在有声语料库中用这种大概相等的方法来解释事情很自然。“相当”作形容词情况我们也做了统计,发现在
报纸语料库中有240项,小说语料库中有30项,而有声语料库中只有1项。通过比较可以看到,“相当”作副词是主要用法,其次是动词,作形容词的比例很小。形容词用法倾向于出现在书面语中。
(二)语域使用情况分析
表1显示出,作典型程度副词用法的“非常”在书面语体中使用频率为156次/百万词,在口语体中使用频率为471次/百万词,在中间语体的小说语料库中的使用频率为114次/百万词。因此,“非常”在书面语中使用率是口语体的三分之一,是中间语体的约1.4倍。
作典型程度副词用法的“特别”在报纸语料库中频率为43次/百万词,在小说语料库中频率很低,约22次/百万词。但在有声语料库中频率为658次/百万词,是报纸语料库的15倍,是小说语料库的30倍。因此,“特别”作程度副词常在口语体中使用,书面语体中用得很少,在小说中用得最少。
“相当”的使用情况差别不如“非常”和“特别”明显。在报纸语料库中频率约38次/百万词,在小说语料库中约98次/百万词,而在有声语料库中约36次/百万词。口语语体和书面语体间的差别不大,在小说语体中的使用率约是其它两个语料库中的使用率的3倍。
为直观起见,我们绘制柱状图:
图1:三个词作典型程度副词在三种语料中的使用分布图
将图1变换,可以得到下图:
图2:三个词作典型程度副词在同一语料库中使用比较图
从图中可以看出,在报纸语料库中,“非常”出现的次数最多,“相当”出现次数少于“特别”,但相差不很大。这表明在报纸类正规书面语体中,人们偏好于使用“非常”和“特别”,而“相当”却不受欢迎。“特别”在小说类中性文体中使用最少,少于“非常”和“相当”,只有它们的一半左右;“相当”不如“非常”常用,但相差不是很多。在有声语料库中,“相当”出现次数最少,而“特别”出现频率为658次/百万词,是“相当”的18倍。“非常”也远远高于“相当”,是“相当”的13倍。
通过以上分析可以得出结论,“特别”在作程度副词时在口语语体中用量最大,远高于书面语和中间语体,也比“非常”和“相当”用的多,这表明人们在口语交际过程中,常用“特别”表示强调。“非常”作程度副词时虽然也偏向口语词,但书面语及中间语体中用的也很多,口语程度弱于“特别”的同时,书面语体彩强于“特别”。“相当”一词界限稍微有些模糊,可以将它看成
一个中性词。和“特别”“非常”相比,口语中用量很小,而且书面语体中频率也最低,倒是在中间语体中出现频率很高。这也证明了我们的结论,即在中间语体中,动词和形容词用法占比例不大。