1. 引言
随着技术的发展,新闻报道成为人们了解社会的一种重要的信息工具,也成为反映当代社会热点的“社会镜子”。但新闻媒体报道的内容并不完全是对社会现实的真实反映。传媒内容会受到社会制度、社会机构、新闻机构、新闻工作惯例以及新闻工作者本身等因素的影响 [1] 。媒体对报道事件的态度会影响受众的观点,塑造着受众的世界观。研究新闻报道态度有助于了解媒体对事件和社会现象的看法,从而更有效地引导社会发展。
2022年北京举办了第十五届冬季奥林匹克运动会,此次冬奥会正值疫情爆发时期,各国对北京冬奥会的举办呈何种评价态度和情感倾向值得深入分析。本研究借鉴评价理论中的态度系统为描写框架,采用定量和定性分析的方法,结合情感分析技术和评价理论的分析框架,探讨北京冬奥会举办前和中,美国主流媒体CNN新闻报道中的聚焦议题变化以及评价态度差异。
2. 文献综述
2.1. 评价理论
评价理论(Appraisal Theory)由Halliday的学生James R. Martin于20世纪90年代提出,是对系统功能语言学人际意义的新发展 [2] ,强调透过对语言的分析来评价语言使用者对事态的立场、观点和态度。评价理论包括一整套评价资源,可以用于语篇分析。介入(Engagement)、态度(Attitude)和极差(Graduation)是评价系统的三个次系统,构成了语言评价的选择资源。评价理论着眼于词汇语义层,通过“评价词汇”来评价语言使用者的意识形态 [3] 。作者可以用评价资源表达观点,读者也可以通过评价资源揭示出作者的情感态度。态度系统是评价系统的核心,包括情感(Affect)、裁决(Judgement)、鉴赏(Appreciation)。读者可以通过语篇中表示“品质”情感(Affect as “quality”)、“过程”情感(Affect as “process”)和“评注”情感(Affect as “comment”)的词汇或短语来分析作者对某种行为或现象的积极或消极情感,也可以根据判断系统中的社会评判(Social esteem)和社会约束(Social sanction)来评价语言使用者的行为。介入系统指语言使用者利用自言和借言两种手段来调节其对所说或所写内容所承担的责任或义务 [3] 。介入系统可以用于分析作者是否使用投射(如:So-called)、情态动词(如:Suppose)、让步(如:But)、模糊词汇(如:Probability, Perhaps等)等借言手段推卸责任,表达客观的情感态度,或通过自言的方式直接介入,对所说语言负责,表达主观性。介入系统在词汇语义层还纳入了情态状语和评论状语、否定形式与引导期待和反期待的连接词等 [4] 。极差系统是用于评价语言使用者语势强(如:Very, Extremely)、弱(如:Just, Reasonably)、聚焦明显(如:Official)或模糊(如:More or so)的资源。
评价理论的一大主要研究对象即为新闻话语的态度研究 [5] 。在新闻话语分析中,重点关注的两点是:一是对新闻话语的隐性态度的关注,作者通常使用看似中性的隐含评价意义来达到客观的目的。二是新闻报道中,消息源和态度立场之间的关系,新闻生产者在报道中体现出的态度可能显露在消息源的不同引用方式中,这也反映了新闻者与消息源之间的距离 [6] 。一些学者通过对新闻语篇中评价资源进行标注、归类,分析语篇建构者对所报道新闻的话语态度和倾向,从而揭示媒体对社会事实的重构、对社会事实本身的态度和立场 [7] 。
2.2. 情感分析
当下开展词汇语义层态度分析的主要方法是情感分析(Sentiment analysis),又称意见挖掘(Opinion mining)或评论挖掘,是自然语言处理领域最重要的分支之一 [8] 。其本质是“在语言中提取主观性和极性”来识别“语义取向”或“单词、短语或文本的极性和强度” [9] 。因此运用情感分析技术可以突人工分析的局限,帮助研究者客观地分析文本内容的情感倾向。目前,情感分析已经被应用于不同领域,如商业领域、新闻邻域、政治领域等。在商业领域,可以通过情感分析技术对商品评论进行分析,帮助消费者和生产商了解该商品的使用情况和用户反馈。石春让和邓林(2020)将文学作品的英译本作为一种商品,通过情感分析技术对葛浩文翻译的11部莫言小说英译本在西方电商平台的所有购买评论进行情感分析,归纳出西方读者群体的代表性评论,进而评判莫言小说在西方国家普通读者群体中的接受态度与特点 [10] 。张璐(2019)运用情感分析技术分析亚马逊网站上读者对《三体》译本的评论,从而分析海外读者对《三体》不同译本的评价态度和接受程度 [11] 。在政治领域,Dilin Liu等人(2018)通过计算机情感分析技术,研究了2016年美国总统大选期间演讲的情感倾向、主题和话语策略。解释了特朗普虽然话语中有明显的负面情绪却获得胜利的原因 [12] 。在新闻领域,Sourav Kunal等人(2018)主要是利用情感分析模型对微博、新闻评论中的热点话题、公众观点进行提取,从而实现对公众评价的情感褒贬识别 [13] 。张琛等人(2021)将情感分析技术运用于新闻领域,以与新冠疫情事件相关的微博用户评论作为研究语料,进行情感特征提取和分类,总结了公众对于新冠疫情在时间和空间上反映出的情绪状态变化和分布特点 [14] 。
2.3. 国际新闻对北京冬奥会的态度研究
自北京冬奥会申办至成功举办以来,许多学者对媒体的相关报道进行了研究。其中一个重要研究方向是探索媒体报道内容的情感变化。刘静轩等人(2022)发现西方媒体在报道北京冬奥会时,延续了其对中国国家形象话语表征的负面倾向 [15] 。黄河等人(2021)发现西方媒体在报道非西方国家举办的奥运会时,报道属性呈现更强烈价值倾向性 [16] 。史伟(2009)通过研究发现在奥运举办期间,西方媒体对中国的报道视角发生了明显的转变,即从质疑、抵制转向肯定和赞扬 [17] 。李丹等人(2022)通过人工阅读的方式,对美国媒体关于冬奥会的报道进行情感基调分析,提出美国媒体在报道冬奥会时,将政策与社会问题等负面效应放大。在肯定此次冬奥会成绩的同时又一次服务于其自身的意识形态 [18] 。但上述研究中的情感分析都局限于人工层面,较为主观。因此本研究尝试运用计算机情感分析技术,客观地分析CNN关于北京冬奥的新闻报道中的情感倾向,并从批评话语分析的角度进一步分析西方媒体在表达积极和消极情感时所使用的话语策略。本研究尝试回答如下两个问题:
1) 在北京冬奥会举办前和举办中,CNN新闻报道的议题体现出哪些不同的聚焦?
2) 在北京冬奥会举办前和举办中,CNN新闻报道的评价态度体现出哪些差异?
3. 研究语料与分析方法
3.1. 语料介绍
本研究以2022年北京冬奥会前后美国有线电视网(Cable News Network, CNN)媒体的相关报道为语料,建立“北京冬奥会CNN报道话语专题语料库”。CNN是美国非常有影响的新闻广播电视公司,也是世界上著名的国际新闻电视机构,具有较大的影响力。研究以“Beijing 2022”、“Beijing Winter Olympics”等为搜索关键词,提取了从2021年3月至2022年2月20日期间的所有报道,语料形符共计97,765词。
3.2. 分析方法
本研究采用基于情感词典的情感分析方法,即使用一个包含目标情感词的情感词汇来帮助确定目标文本的情感,从而对媒体关于冬奥会的评价态度进行判断。
为了分析CNN在报道北京冬奥会举办前和举办中的情感倾向,本研究首先借助了语料库分析软件LancsBox 6.0对北京冬奥举办前和举办中CNN报道的主要议题变化进行分析。LancsBox 6.0是由英国兰卡斯特大学Vaclav Brezina团队开发的语料库软件。具有关键词检索(KWIC)、检索词分布(Whelk)、搭配图解(GraphColl)、N元结构(N-grams)、词汇模块(Words)和文本工具(Text)六大功能模块。其中的词汇模块(Words)可以通过与参照语料库对比显示目标语料库中具有超常频率的词,最终生成主题词表 [19] 。本研究运用该软件的Word功能,以大型综合语料库BNC为参照语料库,得出了北京冬奥会举办前和举办中CNN报道的主题词表,进而分析报道议题的变化。
其次,用情感分析工具TextBlob分析北京冬奥会举办前和举办中CNN在报道不同议题时的情感变化。TextBlob包含了基于情感词典的Pattern Analyzer和基于机器学习的NaiveBayesAnalyzer两种不同的情感分析器。本研究使用基于情感词典的Pattern Analyzer分别计算冬奥运动与运动员、冬奥与政治、冬奥与外交、冬奥与疫情和冬奥与经济五类议题相关的语句的情感极性值。Pattern Analyzer计算出的情感极性值范围下−1到1之间,−1和1分别表示绝对积极情感和绝对消极情感 [10] 。情感极性值为负数表示负面或消极情感,情感极性值为正表示积极情感,情感极性值为0表示中性。
4. 研究结果与分析
4.1. CNN新闻报道在2022北京冬奥会举办前和举办中的议题聚焦差异
本文以大型综合语料库BNC为参照语料库,运用语料库分析软件LancsBox 6.0中的Words功能分别计算出北京冬奥会举办前和举办中CNN相关报道内容的关键词表,并对关键词的频数进行统计。在筛选关键词时,笔者参考相关研究的筛选方法,根据关键词中出现次数的平均值和标准差,确定以“平均值 + 1倍标准差”作为关键词的筛选标准,保留出现次数高于这一标准的关键词进入最终分析 [16] ,并且又将普遍存在于奥运报道中且意值范围过于宽泛的词语去掉,如Winter、Olympics、Games等,仅保留核心议题所涉及的关键词,据此得到了冬奥会举办前和举办中关键词的数量分别为119、177。随后将这些关键词进行梳理、归类,提炼与总结,发现在北京冬奥举办前CNN的报道内容主要集中在冬奥运动与运动员、冬奥与政治、冬奥与外交、冬奥与疫情、冬奥与经济5类核心议题(表1)。在北京冬奥举办举办中,CNN则主要关注冬奥运动与运动员、冬奥与政治、冬奥与外交、冬奥与疫情这4类核心议题(表2)。
从表1和表2中可以看出,不仅相同议题的报道篇幅不同,而且报道的焦点也有很大变化。在冬奥运动与运动员这一议题下,虽然在冬奥举办前和举办中有相同的主题词,例如ICO,ceremony,venus等,但是举办前,IOC,venue,ceremony出现频率相对较高。举办中,频率较高的主题词则转变为与运动员相关的词(例如,Eileen Gu, valieva);以及与比赛项目相关的词汇(skating, snowboarding, skijoring)。同理,在冬奥与政治议题下,相同的关键词有Xi,president,official,nation等。可以看出CNN非常关注我国官方政府和领导人的发言,冬奥会是国家树立政治形象的重要平台,通过举办冬奥会可以展示中国的良好形象。
![](Images/Table_Tmp.jpg)
Table 1. Five key topics covered in CNN’s reports before the Beijing Winter Olympics
表1. 冬奥举办前CNN新闻报道的5类核心议题
![](Images/Table_Tmp.jpg)
Table 2. Four key topics covered in CNN’s reports during the Beijing Winter Olympics
表2. 冬奥举办中CNN新闻报道的4类核心议题
从核心议题可以看出,CNN在报道北京冬奥时,举办前和举办中报道的议题相似,都报道了前四类议题。笔者进一步统计了这4类议题在举办前和举办中的语句数量分布,发现CNN在报道这4类议题时,报道篇幅有很大区别,说明CNN的报道侧重点不同(图1)。通过图1显示,北京冬奥举办前和举办中,语句数量浮动较大的是冬奥与疫情和冬奥运动与运动员两大议题。在冬奥前,冬奥与疫情议题下的语句数量相对较多,共520条,表明此次北京冬奥会举办正值新冠疫情在全球蔓延,媒体会更多的关注举办国疫情局势。在冬奥举办中,与冬疫情相关的语句数量减少到258条,而与冬奥运动和运动员相关的语句数量则达到1286条。可见,CNN对疫情的关注度大大降低,对运动员的关注度增加。除了关注疫情、冬奥运动与运动员外,CNN在冬奥举办前和举办中还报道了冬奥与政治、外交以及经济相关的内容,语句数量变化相对稳定。显然,CNN对此次北京冬奥会报道呈现出“一体多维”的特点,无论是冬奥前还是举办中,CNN都会关注主办国的政治、外交、经济、等情况。与以往不同的是,此次冬奥会举办期间正值新冠疫情在全球蔓延,所以CNN报道了疫情对冬奥的影响。
4.2. CNN新闻报道对2022北京冬奥会举办前和举办中的评价态度差异
通过TextBlob情感分析得出了不同议题下语句的情感值,图2展示了不同议题下的正负情感语句数量分布和占比。
![](//html.hanspub.org/file/41-2912554x7_hanspub.png?20231117083354154)
Figure 1. Distribution of the number of statements on five key topics before and during the Winter Olympics
图1. 冬奥举办前和举办中5类核心议题语句数量分布
![](//html.hanspub.org/file/41-2912554x8_hanspub.png?20231117083354154)
Figure 2. Distribution of the number of positive and negative emotional sentences under different topics
图2. 不同议题下的正负向情感语句数量分布
根据情感分析的结果可以看出,在总体上五类报道议题中情感值为正的语句数量占比大于负向语句数量占比,而且在所有报道内容中,冬奥运动与运动员、冬奥与疫情两类议题相关的语句中,正向语句数量占比均超过了50%。其中冬奥运动与运动员议题下正向语句数量共833句,占比51.8%;冬奥与疫情议题下情感值为正的语句数量较多,共412句,占比53.10%。因此,我们可以初步判定,总体上CNN对此次北京冬奥会的举办呈积极的态度,能够接受和认可中国在冬奥期间采取的疫情管控措施,对整体冬奥的举办和参赛运动员的表现等较为满意。然而,从图2的正、负向语句的数量分布上也可以看出,在上述五类报道议题相关语句中,CNN的负面报道也有很多。例如,在冬奥与经济议题相关的语句中,负面报道占29.10%;冬奥与外交议题下的负面报道占25.10%。这表明CNN对中国政治、经济、体育、文化等方面态度略有改观,正向情感语句数量占比有所增加,但是依然没有摒弃意识形态偏见,报道话语产生了分歧、冲突与对抗。
总体而言,从CNN报道对此次北京冬奥会的成功举办给予积极评价。基于情感分析的结果,笔者将以冬奥前和冬奥中两个时间段,以评价理论中的态度系统为描写层,分析语料中不同主题词的评价意义分布特征,从而探讨话语背后的意识形态特征。
4.2.1. CNN新闻报道对2022北京冬奥会举办前的评价态度
笔者首先使用情感分析工具TextBlob,对比了冬奥前CNN报道内容中正负情感语句数量分布和占比(图3)。根据图3情感分析的结果可以看出,CNN报道内容中与五类议题相关的语句在总体上呈现出正向的情感态度,正向数量占比均大于负向语句数量。表明CNN对冬奥前运动员的准备工作、冬奥对政治、外交、经济的影响以及疫情对冬奥举办的影响情况整体呈现积极的情感态度。冬奥与疫情,冬奥运动与运动员两类议题下正向语句数量占比最大。其中,冬奥与疫情主题报道中,正向语句数量共272句,占比达到了52.30%;冬奥运动与运动员议题下,正向语句数量共154句,占比为47.70%。
![](//html.hanspub.org/file/41-2912554x9_hanspub.png?20231117083354154)
Figure 3. Distribution of the number of emotional statements reported by CNN before the Winter Olympics
图3. 冬奥举办前CNN报道内容的情感语句数量分布
笔者又通过细读文本,发现CNN对北京冬奥会举办前的报道中积极话语主要体现在两个方面:1) 在冬奥与疫情议题相关的内容中,CNN通过高频使用大量表示积极态度的情感词汇体现防疫措施安排合理性与制度优越性。情感值为正的语句中大量出现的表达有:“rigorous prevention and control measures”、“unprecedentedly stringent measures”、“meticulous planning, pervasive surveillance”。其中高频出现的一系列形容词,如“rigorous, unprecedentedly stringent, meticulous”等,都表明CNN对中国严格实施疫情管控持积极肯定的态度。除此之外,CNN采用了大量的直接引语,通过引用运动员的话语,详细描述了运动员从到达北京机场至进入奥运闭环的路程中所有的防疫措施安排。“smooth process”、“surreal”、“completely separated from”、“incredibly organized”、“sealed off behind a transparent wall”、“dedicated lane”等表达向读者展示了中国在闭环体系安排的合理性,可以最大限度的保证闭环内的运动员的安全性。由于直接引用是出于当事人之口,加强了报道的真实性,让读者可以感受到中国实施的严格防疫过程。2) 运用最高级,具体数值等表述在冬奥场馆建设方面建构积极话语。在冬奥前的报道中,除去对以疫情的报道外,冬奥运动与运动员议题的篇幅数量也很多。其中,情感值为正向的语句数量共154句,占比47.70%;负向的语句数量共47句,占比14.60%。在情感值为正的语句中,使用了大量最高级表述来加强语势,如“the greenest”、“the greenest and cleanest”、“the world’s steepest runs”、“the first”,北京将举办最环保、最干净的奥运会,称赞北京冬奥会的滑雪道是现如今世界上最陡峭的,最完美的滑雪道。除此之外,CNN还运用具体数值体现报道的准确性和客观性,如“100% artificial snow”、“30 billion yuan”等。
虽然CNN报道内容中与五类议题相关的语句在总体上呈现出正向的情感态度,但是也有一些负面的表述(图3)。在冬奥与疫情议题下,负向语句数量共112句,占比21.50%;冬奥与经济议题下,负向语句数量占比达到了29.1%。笔者通过细读文本发现一些负面表述。例如,在冬奥与疫情议题下,情感值为负的语句中主要有“anxiety”、“super stressful”等负面词汇,表明疫情使运动员非常焦虑和担忧。同时CNN还运用了“but...”、“while...”、“...although...”、“however...”等让步、转折句式。如“The strict measures are a reflection of China’s zero-Covid policy, although the emergence of more positive cases connected to the Games seems inevitable”体现了CNN虽然肯定了中国防疫措施的有效性,但也表明了该措施带来了一些负面影响。
从以上分析可以看出,在冬奥举办前,CNN大幅报道了冬奥与疫情、冬奥运动与运动员两类议题。在表达积极态度时,主要运用了积极的形容词、比较级、最高级以及具体数值等方式,还大量使用直接引语增强报道的真实性。在负面报道中,主要使用了转折、让步和条件状语从句等句式。
4.2.2. CNN新闻报道对2022北京冬奥会举办中的评价态度
笔者对冬奥举办中CNN报道内容进行情感分析,得出四个议题下的正、负情感语句数量分布(图4)。在冬奥举办期间,总体上CNN对运动员、政治、外交和疫情四个方面均呈积极的情感态度。其中,冬奥运动与运动员议题下正向情感语句数量最多,共679句,占比达到52.80%;冬奥与疫情相关语句中,情感值为正的语句共141句,占比54.70%。
![](//html.hanspub.org/file/41-2912554x10_hanspub.png?20231117083354154)
Figure 4. Distribution of the number of emotional statements reported by CNN in the Winter Olympics
图4. 冬奥举办中CNN报道内容的情感语句数量分布
笔者再次通过细读文本,发现CNN新闻报道对2022北京冬奥会举办中的积极话语体现在以下几个方面:1) 与冬奥举办前相比,大量的正向语句主要集中在与挪威运动员有关的报道中,报道了运动员的精彩表现、参加的比赛项目以及取得的优秀成绩。如“tops”、“really good at”、“record-breaking performance”等积极的情感词汇出现频率较高。CNN还大量运用最高级表达,如“the most golden medals”、“the highest total number of medals”以及具体数字举例说明挪威的优秀成绩。2) 与冬奥举办前相比,CNN在报道运动员时,非常关注朱毅和谷爱玲两位美国出生的中国运动员的表现。其中篇幅占比最大的是谷爱玲的相关报道。报道中出现的高频词汇有“superstar”、“the best skier”、“pride of China”等。表明CNN非常认可并且欣赏谷爱玲在此次冬奥会的表现。除此之外,还大量引用谷爱玲的话,话语中包括“shared passion for the sport”、“unite people”、“forge friendships”等表达。借谷爱玲的话语传播冬奥运动的精神,表明冬奥可以团结人类,激起人们对运动的热情。
同时,笔者发现在虽然CNN新闻报道对2022北京冬奥会举办中积极报道居多,但是消极报道中与疫情相关的情感语句占比19.0%;与外交相关的负面语句数量占24.6%;与运动员相关的负面语句数量占比达17.4%。与政治相关的负面语句占比22.10%。CNN负面报道体现在:1) 将运动员成绩与所受待遇相联系,例如CNN在报道朱毅时,高频词汇包括“attack”、“pressure”、“criticism”、“abuse”、“broken down in tears”等。2) 在报道疫情相关的内容时,情感值为负的句子中“toll”一词的出现频率非常高,还包括“violation”、“panic buying”等负面表达。并且这些词汇所处的语句位置大多数为段落的第一句。除此之外,CNN还间接引用《华尔街日报》和《华盛顿邮报》中的有关报道,将不同的观点融为作者自己话语的一部分,增强文本的声音,将作者的声音主观化。
5. 总结
通过语料库分析软件LancsBox和基于机器的情感分析软件TextBlob,本研究显示了CNN对2022北京冬奥会举办前和举办中在报道议题和评价态度上的变化,可以帮助读者更深入的了解CNN在报道此次冬奥会时所使用的报道框架,话语策略等。
本研究发现CNN对此次北京冬奥会报道议题呈现出“一体多维”的特点,报道内容不局限于冬奥运动与运动员,还涉及了疫情、政治、外交和经济等方面。举办前的报道议题包括冬奥运动与运动员、冬奥与疫情、冬奥与政治、冬奥与外交以及冬奥与经济;举办中的报道议题包括冬奥运动与运动员、冬奥与疫情、冬奥与政治、冬奥与外交几个方面。CNN对冬奥举办前和举办中的报道议题虽然相似,但是报道篇幅与内容的侧重点不同。在冬奥举办前,大幅报道与疫情有关的内容。在冬奥举办中,CNN对疫情的相关报道篇幅减少,对冬奥运动与运动员的报道篇幅增大。从报道内容来看,相同议题下,前与举办中的关注点不同。在冬奥运动与运动员议题下,举办前主要关注疫情防控措施,举办场馆,地区等;举办中则重点关注运动员的表现。
整体上CNN对此次冬奥会举办前和举办中报道内容呈积极态度。在冬奥运动与运动员、冬奥与疫情两类议题相关报道中,情感值为正的语句占比超过了50%。在冬奥举办前,积极话语主要集中在中国的防疫措施与冬奥场馆建设两个方面,CNN在报道2022年北京冬奥会举办中,也运用了积极情感词汇、比较级、最高级以及具体数值等方式,表明对中国防疫措施与冬奥场馆的认可,积极态度明显。