基于COCA语料库的近义词对比分析——以Assert、Claim、Declare和Proclaim为例
Comparative Analysis of Synonyms Based on COCA Corpus—Taking “Assert, Claim, Declare and Proclaim” as Examples
DOI: 10.12677/ML.2023.1111678, PDF, HTML, XML, 下载: 250  浏览: 454 
作者: 赖倩倩:大连海事大学,外国语学院,辽宁 大连
关键词: COCA语料库近义词搭配语域COCA Corpus Synonyms Collocation Register
摘要: 近义词的辨析一直是困扰英语学习者的重点和难点。传统的英语教学在句法和语义层而对近义词进行辨析,但缺乏足够的实例进行论证。语料库因其语料丰富很好的解决了这个问题。本文章基于COCA语料库,从词频、语域分布、搭配、语义韵四个方面切入,辨析了近义动词assert、claim、declare和proclaim,探索了基于语料库的近义词辨析新方法。
Abstract: The discrimination of synonyms has always been the focus and difficulty of English learners. Tradi-tional English teaching discriminates synonyms at the syntactic and semantic levels, but there are not enough examples to prove it. Corpus is a good solution to this problem because of its rich corpus. Based on COCA corpus, this paper analyzes the near-sense verbs assert, claim, declare and proclaim from four aspects: word frequency, register distribution, collocation and semantic rhyme, and ex-plores a new corpus-based method for the analysis of synonyms.
文章引用:赖倩倩. 基于COCA语料库的近义词对比分析——以Assert、Claim、Declare和Proclaim为例[J]. 现代语言学, 2023, 11(11): 5046-5055. https://doi.org/10.12677/ML.2023.1111678

1. 引言

对于所有英语学习者来说,在学习英语的过程中,听、说、读、写、译皆为英语学习者的必要技能。而需要掌握这些技能的必要条件就是词汇的学习。词汇的学习对于每个英语学习者来说都是至关重要的,只有熟练的掌握了词汇,才能提高这五种技能,最终能提高英语学习者的水平。

在英语词汇的学习中,近义词的学习是每个英语学习者必须克服的一大困难。根据2003年贺晓东主编的《英汉双解英语同义词词典》显示,近义词的数量约占英语总词汇量的60%,由此可见,在英语词汇中有一半以上的单词属于近义词,它们通过词义、用法等方面的相同或相近构成了庞大而又复杂的英语词汇体系 [1] 。在《牛津字典》中,近义词被解释为:“a word or expression that has the same or nearly the same meaning as another in the same language”。我们也可以将近义词理解为在同一种语言中意思完全一样或者有细微差别的词。通常,在面对近义词时,学习者大多数时候都会感到迷茫,即使是借助了字典这个工具,他们仍旧不知该如何应用它们,从而导致很多时候都会出现近义词被误用的情况。因此,近义词的辨析对于英语学习者来说很重要,学习者不仅要了解这些词汇的字面意思,并且应该重视其在各种语域中的使用、词频、搭配和语义韵等方面的应用,从而增强英语学习者对这些近义词的理解。

在语料库出现前,词汇研究多集中在词汇意义方面,而电子语料库的出现扩大了词汇研究的范畴。语料库出现之前,学习者通常通过字典或上网查询词汇的意思以及教师对教材的词汇表讲解从而进行词汇的学习,这些方法即耗时又繁琐。用语料库的方法可以有效地区分近义词,因为语料库可以提供大量真实的语料学习者可以利用这些语料对近义词的用法进行分析和判断 [2] 。利用语料库,学习者们不仅可以快速地了解到近义词和词汇的表面意义,更能利用搜索语料库中词汇的词频、语域、搭配和语义韵等方面来准确理解词汇的内涵意义,进而更全面系统地理解近义词。

本文以COCA语料库为语料基础,通过对比研究近义动词assert、claim、declare和proclaim在词频、语域分布、搭配和语义韵这四个方面的异同,更好地让学习者们去运用近义词。

2. 基于COCA语料库对近义词的对比分析

美国当代英语语料库(Corpus of Contemporary American English),以下简称COCA,它是目前最大的免费英语语料库,也是第一个大型的语料平衡的美国英语语料库。语料库由10亿词的文本构成,其中文本有八种类型,分别为博客、网站、电视/电影、口语、小说、杂志、新闻、学术。该语料库由美国杨百翰大学的Mark Davies教授主持创立并在2008年正式上线。

2.1. 近义词Assert、Claim、Declare和Proclaim在COCA语料库中不同语域词频分布的分析

Raid在1956年提出了“语域”这一概念意义,而后由Halliday等人完善了“语域”这一概念。Halliday将语域定义为:语言变体可以按照使用的情况划分为语域 [3] 。语域是人们在实际的语言活动中,出于交际的需要,或因其所从事的职业和兴趣相异,亦或因其话语发生的情景、说话的对象、地点和话题的不同而产生的一种言语变体,体现为语言中的不同语体风格、用语格调等 [4] 。词频通常指的是在语料库中词汇或短语出现的频率的频数,并且它还是研究语料库语言学中重要的一部分。尽管同义词或近义词在表面上的意义并没有很大差别,但其内在意义存在一定的差异,所以它们具有不同的语域分布特征,因此统计同义词或近义词在不同语域中的词频,有助于辨析它们之间的差异,使得英语学习者选择更符合语境的词汇,起到了一定的指导性作用。COCA语料库搜索功能强大,有7种搜索栏,其中包括“List”、“Word”、“Browse”“Chart”、“Collocates”、“Compare”以及“KWIC”等搜索。通过“chart”搜索,可以得到assert、claim、declare和proclaim这四个近义词的词频和语域分布(见表1)。

Table 1. Word frequency and register distribution of near-sense verbs assert, claim, declare and proclaim in COCA corpus

表1. 近义动词assert、claim、declare和proclaim在COCA语料库中的词频及语域分布

在COCA语料库搜索的结果如表1显示,claim在语料库中出现的总频次最高,高达193,069,其次是declare,为47,596,随后是assert和proclaim,分别为20,349和11,788。由此我们可以得出,在近义动词 assert、claim、declare和proclaim中,使用频率最高的是claim,最低的是proclaim。而从这四个词的语域分布来看,assert在学术文章中使用最为频繁,高达7748,而在电视/电影中最不经常使用,由此可以看出assert多用于学术文章这类的正式语体中,而在电视/电影这种口语化的语体中不常使用;claim在网站中使用频率最高,为36,190,博客与其使用频率差距不大,为35,746,由此可见claim的使用也是偏书面化,使用频率最低的在电视/电影中;declare在网站中使用频率最高,为8438,在电视/电影中使用频率最低;proclaim在杂志和学术文章中词频最高,在电视/电影中最低。总的来说,这四个词在电视/电影这种口语化的语体中都不经常使用,并且这四个词都倾向于在正式语体中使用。

Table 2. The historical development trajectories of near-sense verbs assert, claim, declare and proclaim in COCA corpus

表2. 近义动词 assert、claim、declare和proclaim在COCA语料库中的历史发展轨迹

通过对COCA语料库的检索,我们还可以看到这四个词的历史发展轨迹(见表2),从历史的角度可以看出,claim使用频率尽管在1995~2014年不停减少,但2015~2019年当中大幅度增多,总体呈上升趋势。而assert的使用频率则有些变化,大体上呈下降趋势,这说明人们在逐渐地减少assert的使用。而且declare在这几十年中,使用频率不断变化,浮动较大,大体呈下降趋势。而proclaim自1990年以来,使用频率一直在下降,说明proclaim现逐渐已不被使用。

通过分析assert、claim、declare和proclaim在COCA语料库中的词频及语域分布以及历史发展轨迹还并不能明确分辨出这些近义词内在意义的差别。

2.2. 近义词Assert、Claim、Declare和Proclaim在COCA语料库中的搭配异同分析

搭配一直以来就是词汇研究的重点,为了区分近义词,根据其搭配词来辨析通常是一种重要的方法。具体来讲就是从语料库中将关键词的所有搭配词提取出来,采用统计手段来测量各搭配词与关键词共现的显著程度,以确定各词项之间在多大程度上相互吸引,进而概括出词项的典型搭配程度 [4] 。由于动词经常与名词和副词搭配,因此本章将会对这四个近义动词的名词和副词搭配进行分析。

2.2.1. 名词搭配分析

COCA语料库可以搜索到assert、claim、declare和proclaim四个近义动词所搭配的名词,通过设置相关检索,可得到四个近义动词的所有搭配名词,并选择频数排名前10的显著名词制作了表3~6。

通过表3可以看出,与assert搭配的10个显著名词语义分别是控制权、行政权、权利、司法权、统治地位、所有权、领导地位、主权、版权、独立,从这10个词的词义可以看出,assert大部分搭配的显著名词都含有“权利”的意思,且其中control (控制权)搭配的频数最高(119),dominance (统治地位)的MI值最高(7.36)。因此,我们可以得出assert一般与表示政治“权利”相关的抽象名词搭配。根据表4可以看出,与claim搭配的10个显著名词语义分别是责任、胜利、所有权、调整器、庇护、自卫作者、亲子鉴定、受害者、辩护,其中responsibility出现的频次最高(1030),而adjuster的MI值最高(9.39),综合可得claim经常与“司法”相关的抽象名词搭配。从表5可看出,与declare搭配的10个显著名词的词义分别是战争、破产、胜利、独立、伤残者、圣战、国家地位、忠诚、中立、角色。其中,war (战争)词频高达1806,bankruptcy (破产)的MI值最高(9.52),基于此,我们可以得出declare常与“战争”相关的名词搭配,且与“破产”搭配度最高。表6显示,与proclaim搭配的10个显著名词词义分别是自由、胜利、独立、忠诚、清白、救赎、预言家、感恩节、奉献、皇帝,其中liberty (自由)和victory (胜利)词频最高,为30,但这两者中MI值较高的为liberty (6.18),这10个名词中MI值最高的是allegiance (6.80),综合可得,proclaim常与像liberty和allegiance这样的描述性抽象名词搭配。

Table 3. Significant nouns used with “assert” in COCA corpus (Word frequency not less than 12)

表3. “assert”在COCA语料库中搭配的显著名词(词频不低于12)

Table 4. Significant nouns used with “claim” in COCA corpus (Word frequency not less than 12)

表4. “claim”在COCA语料库中搭配的显著名词(词频不低于12)

Table 5. Significant nouns used with “declare” in COCA corpus (Word frequency not less than 11)

表5. “declare”在COCA语料库中搭配的显著名词(词频不低于11)

Table 6. Significant nouns used with “proclaim” in COCA corpus (Word frequency not less than 4)

表6. “proclaim”在COCA语料库中搭配的显著名词(词频不低于4)

2.2.2. 副词搭配分析

动词除了有名词搭配还有副词搭配。通过COCA语料库可以搜索assert、claim、declare和proclaim四个近义动词所搭配的所有副词,具体操作步骤与搜索名词搭配相差不大,并选择频数排名前10的显著副词制作了表7~10。

通过表7可以看出,与assert搭配的10个显著副词的词义分别是反复地、自信地、大胆地、错误地、有力地、断然地、不正确地、错误地、毫不含糊地、着重地,其中repeatedly的词频最高(63),confidently的MI值最高(9.63)。与assert搭配的副词可以分为三类:其中时间频率副词只有repeatedly,方式副词有:confidently、boldly、falsely、incorrectly、erroneously、unequivocally,程度副词有:forcefully、flatly、emphatically。基于此,我们可以得出assert一般与时间副词、程度副词和方式副词搭配,且与方式副词搭配明显多于与时间副词和与程度副词搭配。

表8可以看出,与claim搭配的10个显著副词的词义分别是错误地、反复地、自豪地、合法地、正当地、正确地、大胆地、令人信服地、可信地、错误地,其中falsely词频和MI值都是最高的,分别为358和8.10。由此可见,与claim最经常搭配且搭配度最高的是falsely。与出claim所搭配的副词可以分为两类,一类为时间频率副词:repeatedly,另一类为方式副词:falsely、proudly、legitimately、rightfully、rightly、boldly、credibly、plausibly、wrongly。基于此,我们可以得出claim一般与时间副词和方式副词搭配,且与方式副词搭配明显多于与时间副词搭配。

通过表9可以看出,与declare搭配的10个显著副词的词义分别是正式地、公开地、在此、公开地、正式地、自豪地、著名的、合法地、单方面地、大胆地,其中officially词频最高(274),MI值最高的是hereby (9.60)。与declare搭配的副词可以分为两类,一类为地点副词:hereby,另一类为方式副词:officially、publicly、openly、formally、proudly、famously、legally、unilaterally、boldly。基于此,我们可以得出declare一般与地点副词和方式副词搭配,且与方式副词搭配明显多于与地点副词搭配。

表10可以看出,与claim搭配的10个显著副词的词义分别是自豪地、大声地、公开地、大胆地、公开地、正式地、在此、最近、反复地、最近,其中proudly的词频与MI值最高,分别为155和9.92。由此可见,与proclaim最经常搭配以及搭配度最高的是proudly。与proclaim搭配的副词可以分为三类:其中地点副词只有hereby,时间频率副词有:recently、newly和repeatedly,其余的proudly、loudly、publicly、boldly、openly和officially为方式副词。基于此,我们可以得出proclaim一般与时间副词、地点副词和方式副词搭配,且与方式副词搭配明显多于与时间副词和与地点副词搭配。

Table 7. Significant adverbs used with “assert” in COCA corpus (Word frequency not less than 8)

表7. 与“assert”在COCA语料库中搭配的显著副词(词频不低于8)

Table 8. Significant adverbs used with “claim” in COCA corpus (Word frequency not less than 27)

表8. 与“claim”在COCA语料库中搭配的显著副词(词频不低于27)

Table 9. Significant adverbs used with “declare” in COCA corpus (Word frequency not less than 65)

表9. 与“declare”在COCA语料库中搭配的显著副词(词频不低于65)

Table 10. Significant adverbs used with “proclaim” in COCA corpus (Word frequency not less than 13)

表10. 与“proclaim”在COCA语料库中搭配的显著副词(词频不低于13)

3. 语义韵

语言中很多词语本身就体现了语言的态度,词汇作为构成语篇的基本语言单位,在语篇的线性展开中往往表现出搭配的倾向性:它们习惯性地吸引某些具有相同和相似的语义特点的词项,与之构成搭配关系。由于这些词项相同或相似的语义特征,与关键词项在文本中的习惯性的共现,关键词也就被“传染”上了有关的语义特征,它所在的语境也就弥漫了一种特殊的语义氛围,即语义韵 [5] 。语义韵的命名灵感来源于Firth的韵律概念。1987年,Firth的学生,英国语言学家Sinclair,基于此提出了语义韵的概念——语义韵具有同样或类似特点的表达习惯或重复地与关键词搭配出现,形成的一种特殊的语义氛围词汇 [6] 。搭配在语篇中往往会形成三类语义韵:积极语义韵、中性语义韵和消极语义韵。在消极语义韵中,节点词所吸引的词汇几乎都带有鲜明的消极语义特征,它们使整个语境呈现出一种负面的、消极的语义氛围。积极语义韵的情况则恰恰相反,节点词所吸引的词汇具有积极的搭配词汇,由此形成一种积极的语义氛围。在中性语义韵中,搭配词的语义特征处于模棱两可状态,既有消极含义的词项出现,也有积极含义的词项出现,呈现出一种错综的语义特征。语义韵研究可以丰富人们对语言规则的认识,加深对语言运作机制的理解,促进人们重视词语行为模式 [7] 。因此,语义韵概念的引入对于近义词的态度标示功能的确定将起到很好的解释作用。

从上文搭配分析的数据可知,与assert搭配的显著名词都是中性词,与assert搭配的显著副词中,confidently、boldly、forcefully、flatly、unequivocally、emphatically都是褒义词,falsely、incorrectly、erroneously为贬义词,repeatedly中性词;与claim搭配的显著名词中,responsibility、victory、self-defense为褒义词,victimhood为贬义词,ownership、adjuster、asylum、authorship、paternity、vindication均为中性词,与claim搭配的显著副词中,proudly、legitimately、rightfully、rightly、boldly、credibly、plausibly都是褒义词,falsely和wrongly为贬义词,repeatedly为中性词;与declare搭配的显著名词中,victory、independence、jihad、allegiance都是褒义词,invalid和bankruptcy为贬义词,war、statehood、neutrality、persona为中性词,与declare搭配的显著副词中,officially、publicly、openly、formally、proudly、famously、legally、boldly都是褒义词,unilaterally为贬义词,hereby为中性词;与proclaim搭配的显著名词liberty、victory、independence、allegiance、innocence、salvation、prophet、thanksgiving、devotion都是褒义词,emperor为中性词,与proclaim搭配的显著副词中,proudly、loudly、publicly、boldly、openly和officially都是褒义词,hereby、recently、newly和repeatedly都是中性词。基于此,可将这四个近义词的语义韵总结绘制成表11

Table 11. Semantic rhyme changes of nouns and adverbs used with assert, claim, declare and proclaim

表11. 与assert、claim、declare和proclaim搭配的名词和副词的语义韵变化情况

表11可以看出,近义动词assert的语义韵随着所搭配词的词性变化而变化,而claim、declare和proclaim的语义韵并不会随着搭配词的词性变化而变化。Assert的显著搭配词为名词时,则其表现出中性语义韵,若显著搭配词为副词时,则其表现出中性、积极和消极语义韵;claim的显著搭配词为名词时,则其表现出积极、中性和消极语义韵,若显著搭配词为副词时,则其既表现出消极积极语义韵,也表现出中性语义韵;declare的显著搭配词为名词时,则其表现出积极、中性和消极语义韵,若显著搭配词为副词时,则其既表现出消极积极语义韵,也表现出中性语义韵;proclaim的显著搭配词无论是名词还是副词,都表现出中性和积极语义韵。

4. 结语

语料库的出现为英语学习者对近义词的应用和辨析提供了一个更为有效且可行的方法。英语学习者若能善用语料库,便可以更自如地掌握英语词汇的地道用法。就本文而言,利用COCA语料库,对assert、claim、declare和proclaim这四个近义词在词频、语域分布、搭配和语义韵上这四个方面进行了对比分析。结果发现:第一,在词频及语域分布和历史发展方面,claim的词频最高,其次是declare和assert,proclaim的词频最低。四个词均在正式语体中频繁使用。并且在这四个词中,只有claim使用频率在这几十年总体是增多的,其余三个词随着时间的推移都在减少使用。第二,在搭配方面,assert一般与表示政治“权利”相关的抽象名词搭配,一般与时间副词、程度副词和方式副词搭配,且与方式副词搭配明显多于与时间副词和与程度副词搭配。Claim经常与“司法”相关的抽象名词搭配,一般与时间副词和方式副词搭配,且与方式副词搭配明显多于与时间副词搭配。Declare常和“战争”相关的名词搭配,一般与地点副词和方式副词搭配,且与方式副词搭配明显多于与地点副词搭配。Proclaim常与像liberty和allegiance这样的描述性抽象名词搭配,一般与时间副词、地点副词和方式副词搭配,且与方式副词搭配明显多于与时间副词和与地点副词搭配。第三,在语义韵方面,assert的语义韵随着所搭配词的词性变化而变化,而claim、declare和proclaim的语义韵并不会随着搭配词的词性变化而变化。

由于语料库中富含大量语料,它可以作为一个辅助工具,不仅让英语学习者可以方便快捷地搜索到自己想学习的内容,提高他们的学习效率,也将大大激发他们的学习动机,还能使英语课堂变得灵活,教学过程变得更有效率。

参考文献

参考文献

[1] 李婧怡. 基于COCA语料库的英语近义词对比分析——以ability和capability为例[J]. 海外英语2020(15): 3-4, 15.
[2] 王春艳. 基于语料库的中国学习者英语近义词区分探讨[J]. 外语与外语教学, 2009(6): 27-31.
[3] Halliday M.A.K and Hasan, R. (2012) Cohesion in English. Foreign Language Teaching and Research Press, Beijing.
[4] 张继东, 刘萍. 基于语料库同义词辨析的一般方法[J]. 解放军外国语学院学报, 2005, 28(6): 49-52, 96.
[5] Louw, B. (1993) Irony in the Text or Insincerity in the Writer?—The Diagnostic Potential of Semantic Prosodies. Text and Technology: In Honour of John Sinclair, In Baker, M., Francis, G. and Tognini-Bonelli, E., Eds., John Benjamins, Amsterdam.
https://doi.org/10.1075/z.64.11lou
[6] Sinclair, J. (1991) Corpus Concordance and Collocation. Oxford University Press, Oxford.
[7] 卫乃兴. 词语搭配的界定与研究体系[M]. 上海: 上海交通大学出版社, 2002.