1. 引言
句法复杂度(syntactic complexity),又称句法成熟度(syntactic maturity)或语法复杂度(grammatical complexity),指语言产出中句法结构的多样性(variety)、复杂性(sophistication)和拓展性(elaboration)。句法复杂度能够反映二语学习者的句法储备以及输出能力。由于国内对于句法复杂度的研究时间不长,尚处于发展时期,所以此领域的综述文章较少,更是缺乏对于句法复杂度的可视化分析。本研究利用CiteSpace软件,对1999至2023年间CNKI数据库中关于句法复杂度的中文学术文献进行知识图谱可视化分析,旨在掌握该领域在中国的最新研究进展。
2. 研究方法
2.1. 数据来源
本研究的文献数据来源于中国知网(CNKI),以“句法复杂”为主题进行篇名搜索,将语言限定为中文,最终检索到共447篇文章,文献时间跨度为1991~2023年。经过对重复及不相关文献进行剔除,最终选取2009~2023年期间的274篇文献作为分析对象。
2.2. 研究工具和方法
CiteSpace由美国华裔学者陈超美教授开发,是一款基于Java语言的可视化分析软件[1],它通过可视化手段分析文献数据中蕴藏的潜在知识,呈现科学知识的结构、规律和分布情况[2],对于某一学科和技术领域的信息全景、热点主题、研究前沿以及发展历程的分析和预测都呈现出强大的优越性与精确性[3]。将本文研究文献经CiteSpace (5.0.R1版)软件数据转换,并设置分析时间跨度为2009~2023年,时间区分为1年,时间切片阈值为50,分别进行文献增长规律与专业来源、研究机构与作者、研究方法、研究热点、研究前沿的相关分析。
3. 数据分析与图谱解读
3.1. 发表基本情况
3.1.1. 年度发文量分析
研究论文的年度发表数量是衡量一个学术领域发展趋势的重要指标。通过分析所收集文献的发表年份数据,我们可以洞察该领域的兴衰变化。本文收集到了2009~2023年句法复杂度相关论文的发表数量变化折线图(见图1)。
Figure 1. Distribution of research results on syntactic complexity in China
图1. 国内句法复杂度研究成果分布
3.1.2. 研究机构与作者分析
Figure 2. Distribution of institutions conducting research on syntactic complexity in China
图2. 国内句法复杂度研究机构分布
图2为发文数量为前二十的机构,由图可知,发文数量较多的机构分别是“浙江大学”、“吉林大学”以及“北京外国语大学”和“广东外语外贸大学”。各节点之间几乎没有连线,可见各研究机构之间合作发文的情况非常少,且总体来说,研究“句法复杂度”的机构较为分散。句法复杂度研究多用于英语语言研究,因此研究机构多为外语大学。
Figure 3. Distribution of authors conducting research on syntactic complexity in China
图3. 国内句法复杂度研究作者分布
对于“句法复杂”主题进行研究的研究者共计204位。图3为国内发文数量前二十的作者,发文数量较多的作者为易保树、张会平、郑咏艳以及张思雨,为四篇,显示出他们在句法复杂度研究领域的持续贡献。然而,整体来看,在这一领域持续进行研究的学者相对较少。根据统计,发文4篇、3篇、2篇、1篇的研究者分别占全部研究者的1.96%、2.45%、9.8%、85.78%。
3.2. 关键词和研究趋势分析
3.2.1. 高频关键词和关键词共现
Figure 4. Co-occurrence graph of keywords in research on syntactic complexity in China
图4. 国内句法复杂度关键词共现图谱
通过关键词可以快速地了解一篇文章的主要研究内容,它是文章的精髓、内容的浓缩、研究的方向,对其进行分析能够把握研究的热点与前沿,CiteSpace的关键词共现与聚类便可分析研究领域的热点与前沿[4] [5] [6]。研究热点是在某一时期内,有内在联系的、数量相对较多的一组论文所探讨的热门问题或专题,文献关键词词频的高低分布可以用来研究该领域的发展动向和研究热点[7]。高频关键词是指在特定研究领域中出现频率最高的关键词,利用关键词共现分析可以揭示该领域的研究前沿和热点信息[3]。
关键词的大小和他们之间连线的数量可以清晰地呈现关键词之间的共现关系,有助于揭示研究领域中关键词之间的重要性和关联程度。其中,节点(N)数为289个,连线(E)数为585条,见图4。节点大小反映了关键词的出现频次,连线数量则表示它们之间的关联程度。由此可以看出,共现频率较高的关键词分别是“句法复杂度”、“句法复杂性”、“准确度”、“词汇复杂度”、“二语写作”、“英语写作”、“任务复杂度”、“流利度”。“二语写作”和“英语写作”是研究的对象,“任务复杂度”是影响句法复杂的因素,“准确度”、“流利度”、“复杂度”是语言的三个要素,因此常常与“复杂度”一起研究。
Table 1. Frequency of keywords in research on syntactic complexity in China
表1. 国内句法复杂研究关键词频率
序号 |
年份 |
关键词 |
频次 |
中心度 |
1 |
2011 |
句法复杂度 |
133 |
0.81 |
2 |
2012 |
句法复杂性 |
26 |
0.29 |
3 |
2009 |
准确度 |
25 |
0.19 |
4 |
2011 |
词汇复杂度 |
23 |
0.17 |
5 |
2013 |
二语写作 |
23 |
0.13 |
6 |
2009 |
复杂度 |
21 |
0.03 |
7 |
2012 |
英语写作 |
21 |
0.16 |
8 |
2012 |
任务复杂度 |
20 |
0.17 |
9 |
2009 |
流利度 |
16 |
0.04 |
10 |
2020 |
语言复杂度 |
13 |
0.04 |
11 |
2012 |
语料库 |
13 |
0.07 |
本文利用CiteSpace软件,将节点类型(Node Types)设为“关键词”(Keywords),提取“句法复杂”研究的关键词,其中出现频次排在前11位的关键词如表1所示。出现频次可以反映关键词的受到关注的程度。除此以外,CiteSpace还可以计算中心性,表示关键词的重要程度。表1中的中心性为中介中心性(betweenness centrality),是“测度节点在网络中位置重要性的一个指标”[7]。根据李杰和陈超美的观点,在CiteSpace中被称为“转折点”(turning point),具有高中介中心性的文献可能成为连接两个不同领域的关键枢纽[7]。从信息传输角度来看,中介中心性的增加意味着节点的重要性增加,去除这些节点后对网络信息传输的影响也随之增大。在表1中,“句法复杂度”、“句法复杂性”、“准确度”、“词汇复杂度”、“二语写作”、“英语写作”、“任务复杂度”这7个关键词的中介中心性大于0.1,因此被认为是重点标注对象。因此,除去本研究主题词“句法复杂度”和“句法复杂性”外,“准确度”、“词汇复杂度”、“二语写作”、“英语写作”、“任务复杂度”是研究中的重要节点,是不同学科研究之间的关键节点。
3.2.2. 关键词聚类分析
关键词聚类分析(cluster analysis)主要用于反映某研究领域的主题结构,是对该领域主要研究内容和研究热点进行分析的科学手段[8]。关键词聚类图谱可总结各关键词节点间的相似性,依据数据运算将共词关系明显的节点聚成一类,准确描绘研究前沿的重点[7]。
在关键词频次和共现分析的基础上,关键词聚类分析可以进一步揭示“句法复杂”的主要研究领域与主题。本研究对“句法复杂”主题进行关键词聚类分析,主要选取前七个聚类,如图5所示,分别为
Figure 5. Clustering graph of keywords in research on syntactic complexity in China
图5. 国内句法复杂度研究关键词聚类图谱
“句法复杂度”、“句法复杂性”、“词汇复杂度”、“任务复杂度”、“读后续写”、“英语写作”、“复杂度”、“二语写作”。
结合关键词共现图、高频关键词以及关键词聚类图,可以发现对于句法复杂的研究主要分为以下四类:
首先是,任务复杂度对产出的句法复杂度的影响。此类研究主要是研究不同的影响因素对于产出作品的句法复杂度有什么影响,影响因素还包括句式转换训练、读后续写以及英语小说阅读等。比如任务的体裁要求不同会对产出的句法复杂度产生影响。张煜杰、蒋景阳以我国高考英语改革后出现的三种写作题型——应用文写作、读后续写和概要写作为研究对象,对其进行任务复杂度上的区分,发现高复杂度的写作任务有助于提高写作产出的句法复杂度[9]。王丽萍等以四项复杂程度不同的英语写作任务为实验材料,采用39项语言复杂度测量指标,比较全面地考察了外语写作任务复杂度中元素和背景知识两个变量对语言复杂度的影响。发现任务复杂度对语言复杂度的不同维度产生不同的影响[10]。
其次是,产出作品的句法复杂度,其中产出作品包括书面语和口语以及不同水平的产出。此类研究采用不同颗粒度的句法复杂度指标对产出作品进行句法复杂度研究,主要对英语学习者进行历时或共时以及个案或群体的英语水平进行研究。此项研究常常也会同时涉及对产出作品的准确度和流利度的衡量。王华使用多层次模型方法,分析了中国英语学习者议论文中名词短语复杂度5个学期的历时变化[11]。张会平和张思雨基于动态使用视角,从句法复杂度指标和句型种类两个维度,考察了中国三语初学者英语书面语句法复杂度的发展特征[12]。研究发现,句法复杂度各指标发展趋势并不均衡,中国三语初学者英语书面语句法复杂度产出能力较弱,但随着年级的升高总体呈上升趋势。
然后是,句法复杂度与写作质量的关系。此类研究主要探究句法复杂度与写作质量是否成正比以及句法复杂度对写作质量的预测力。李慧娴等考察了精细化句法复杂度对多维度写作质量的预测效果[13]。研究对1个综合型句法复杂度指标和15个精细化句法复杂度指标建立回归模型,结果显示,精细化句法复杂度能够作为综合型句法复杂度的补充,更细致地呈现高质量作文的句法特征。朱周晔以学习者的汉英译文为语料,选取15个名词修饰语指标,研究发现,学习者译文中名词短语复杂度随着翻译水平的提高而增加,且名词短语复杂度与译文分数之间存在显著的相关性[14]。
最后是中国英语学习者和英语母语者句法复杂度的对比研究。此类研究主要对比英语学习者和英语母语者的句法复杂特征,探究其影响因素,旨在提高英语学习者的英语水平。刘黎岗和明建平从句子长度、句式结构、短语结构对中国英语学习者、英语本族语者以及日、法、德国学习者口语句法复杂度进行比较[15]。研究发现,中国学习者较多使用动词和以动词为中心的分句。这一特征与英汉不同的概念化方式有关。
3.3. 研究趋势分析
研究前沿是在该领域内存在的一组突现的动态概念和潜在的研究问题,对研究方向的明确起到至关重要的作用。图6是在关键词共现分析的基础上生成的关键词时区视图。图中所有节点被设置在不同的时区中,某一时区中的节点越多,说明这一时间段中的研究热点越多,该领域处于繁荣时期;某一时区中的节点越少,说明这一时段中的研究热点越少,该领域处于低谷期。通过各时间段之间的连线关系,可以看出各时间段之间研究热点的更新和传承关系。由图我们可以看出,从2015年到2023年,该领域的研究处于较为繁荣的时期,这一点从年度发文量也可以看出。虽然不断有新的研究热点出现,但从2009年到2015年的研究热点的连线可以看出,这些早期重要的关键词与后期的关键词仍然存在密切的共现关系。“句法复杂度”、“流利度”、“复杂度”、“准确度”以及“发展指标”等关键词具有较好的延续性,覆盖的时间跨度较长,在过去20年中一直受到持续关注。
Figure 6. Timeline graph of keywords in research on syntactic complexity in China
图6. 国内句法复杂度研究关键词时区图
为深入了解关键词演化,我们通过突发性探测分析研究数据,并按突发起始时间对其排序,获得了9个突变关键词,如图7所示。具有突发性特征的节点被标为红色。其中,具有突发性特征的节点以红色标示。突发强度(strength of burst)的值与突变强度呈正相关,突变强度越高,关键词具有更高的影响力,进而显示其是该时间跨度内该领域的研究热点。
图7展示了句法复杂度研究领域排名前12的高突现性关键词。每个关键词都包含突现强度和突现时间两个维度。从图中可以看出,句法复杂度研究的突现词随时间呈现发展趋势。由突现关键词我们可以发现,对于句法复杂度的研究从口语产出倾向于书面语。
Figure 7. Emergence of keywords in research on syntactic complexity in China
图7. 国内句法复杂度研究关键词突现
4. 总结
通过对2009~2023年CNKI数据库中句法复杂度研究文献进行年发表量、作者和机构研究情况、关键词共现和聚类、研究趋势进行分析,发现以下情况:第一,从文献发表情况看,2009~2015年是句法复杂度研究的起步探索期,2015~2023年为持续快速发展期。第二,从研究作者和机构看,作者和机构之间的合作研究非常少,研究非常分散,且大多数研究机构与研究者对该主题的研究缺乏持续性。第三,从关键词共现的分布、聚类和时区图的情况看,句法复杂度研究集中于句法复杂特征研究,研究热点丰富,主题广泛,表现出研究者对句法复杂领域的学术兴趣。