1. 引言
随着人工智能技术的不断发展,机器翻译技术也不断受到关注,使用频率不断增加。日语机器翻译研究较英语机器翻译研究起步较晚,但也取得了很大成果。本文选取了日语中使用频率较高的“ちょっと”一词进行考察和分析。该词暧昧性强,词义的判别很多情况下需要依赖语境和说话人情感。以“ちょっと”为研究对象的文章在知网上并不少,有一部分是考察它的含义、用法(杨悦2017 [1] ;王盟2011 [2] ;刘硕2010 [3] ),一部分是考察它的翻译(韩成军2014 [4] ;李春玲2013 [5] )认为“对于日语程度副词的翻译,应细分其使用情况及其所表达的语气、语境,在此基础上,根据其表达的不同情况做有针对性的翻译。”还有一部分是考察它所体现的语用功能和文化(崔春爱2016 [6] ;田妍2014 [7] ;孙巧慧2013 [8] )。但是这些文章都没有从机器翻译的角度去考察“ちょっと”一词。(王雪钢2007 [9] )是唯一一篇文章从机器翻译角度考察了“ちょっと”一词的文章。这篇文章考察了“ちょっと”与独词句的机器翻译,但仅是对以“ちょっと”为例的独词句做出了考察,如:“時間があれば行きたいですが。ちょっと。”关于“ちょっと”一词的其他很多用法文章并未做出详尽考察。本文基于语料库考察“ちょっと”的机器翻译状况,所考察的“ちょっと”语义、用法更加丰富、全面。
2. “ちょっと”的词义
“ちょっと”是程度副词,它用处广泛。一般表示时间短、程度低的意思。“ちょっと”除了常用的基本意义外,还衍生出了很多其他用法。根据场合不同,用其词典中词义解释不通的情况也有存在。如“ちょっと話せないけど”中该词表示拒绝的意思。
“ちょっと”除了在书面语中常用,在会话中也经常出现。该词根据说话场景以及说话人双方关系的亲疏而具有不同的词义。日本文化中有一个现象是站在对方的角度为对方考虑问题,这使得日本的语言也带有这一特色,在谈话时为避免给对方带去负担和困扰而选择委婉、暧昧表达。而“ちょっと”正体现了这种日语暧昧性。
2.1. 词典中“ちょっと”的词义
本文目的在于考察机器翻译日中翻译状况,综合考察各种词典的词义解释以及例句特点之后,作者选用了《小学馆日中词典》。词典中会给出词汇对应的中文意思,并辅助简练的日语解释并给出辅助理解的日文例句,其日文例句有对应的中文解释。在考察语料库语句的“ちょっと”词义归属时,词典中给出的例句为笔者提供了很好的参考。同时,为了增加考察的完善性,笔者还选取了《三省堂超级大辞林》和《广辞苑(第六版)》两本词典,对“ちょっと”的词义解释做对比。
《小学馆日中词典》词典中“ちょっと”有以下词义:
① (時間的に)一会儿,一下;(とりあえず)暂且
~考えてから/稍加考虑之后
約束の時間には~早いから彼女はまだ来ていないだろう/离约好的时间还有一会儿,也许她还没有来吧
② (量や程度が)一点,有点,一些,稍微
5万円と~/五万日语还多一点
~した風邪/轻微的感冒
もう~のところで電車に乗りそこなうところだった/差点儿没坐上电车
③ (簡単には)不太容易……,不太……,一时难以……
~直らない/不太容易修好
~返事ができなかった/一时没能回答上来
そんなことになるとは~考えられない/真想不到会是这样
④ (大した)相当,还可以
~した財産/相当的财产
~ひどすぎる/太不像话
彼はこの辺では~は知られた顔だ/他可是这一带小有名气的人
⑤ (呼びかけ)喂,你呀
~すみませんが/喂,请问(劳驾)……
~来てくれないか/喂,来一下好吗?
《三省堂超级大辞林》词典中对“ちょっと”的释义如下:
ちょっと[1] [0]【一寸·鳥渡】
一(副)
〔「ちっと」の転〕
数量·程度などがわずかなさま。時間が短いさま。「もう–で母の背丈を越す」「–目を放した隙に」「絵を–習ったことがある」
(笔者翻译:表示数量、程度较少。时间短。)
① 軽い気持ちで行うさま。特に何という考えもなく行うさま。「–行って見てくる」「暇なら–出て来ないか」「–お茶でもいかがですか」
(笔者翻译:以轻巧的态度做某事。不假过多考虑地进行某事。)
② 大層というほどではないが,かなりの程度・分量であるさま。「その道では–名の通った人」「–いい感じじゃないか」
(笔者翻译:虽然不算非常高,但表示有一定的程度和分量。)
③ (下に打ち消しの語を伴って)簡単には(……できない)。「彼が犯人とは–考えられない」「私には–わかりかねます」
〔「ちょっとは」などの場合,アクセントは [3] 〕
(之后常伴有否定词,表示(不能)简单地……)
二(感)
軽く相手に呼び掛ける語。もしもし。「–,君,待ちたまえ」
〔「鳥渡」は当て字〕
(笔者翻译:轻松地向对方打招呼词语。喂。)
《广辞苑(第六版)》词典中对“ちょっと”的释义如下:
ちょっと(一寸·鳥渡)
(副)
① わずか。少し。浮世草子、好色万金丹「柚味噌を–ねぶるもさもし」。「–の事にも」「一時間–で終わる」
(笔者翻译:少量。一点。)
② (逆説的に)存外。かなり。「–金がある」
(笔者翻译:(反过来说)意外地。相当。)
③ しばらく。(呼びかけにも使う)「–待って下さい」「–、あなた」
(笔者翻译:一会儿。(打招呼时也会使用))
④ ほんのついでに。「–寄ってみる」
(笔者翻译:只是顺便。)
⑤ (否定の語を伴って)少々のことでは。そう簡単には。「–できない」
(笔者翻译:(伴有否定用语)稍微地。简单地。)
2.2. 《小学馆日中词典》、《三省堂超级大辞林》和《广辞苑(第六版)》 词典中“ちょっと”词义比较
![](Images/Table_Tmp.jpg)
Table 1. Comparison of definitions in three dictionaries
表1. 三个词典释义对比
以上表1为三个词典释义的对比。为了对比方便,三个词典的词义都做了一些精简只保留了核心意思。《小学馆日中词典》的5个词义顺序没有被打乱,《三省堂超级大辞林》和《广辞苑(第六版)》的释义顺序根据《小学馆日中词典》5个词义顺序做了调整,选择相近的释义排列在同一行。对比发现,三个词典对“ちょっと”的释义都是5个,数量相同。表格中的第一行释义,三个词典表述有很大不同。但根据词典列出的例句《小学馆日中词典》「~考えてから」、《三省堂超级大辞林》「~行って見てくる」、《广辞苑(第六版)》「~寄ってみる」,笔者把他们归为相似的一类,但并非完全相同。其他4种的释义,三个词典相同。
2.3. 语料库中“ちょっと”的词义使用情况,与词典词义并非完全一致
本文所选用的语料库是《现代日语书面语均衡语料库》(『現代日本語書き言葉均衡コーパス(Balanced Corpus of Comtemporary Written Japanese: BCCWJ)』),它是以把握现代日语书面语的整体状况为目的构建的语料库,是现在日语方面唯一可以使用的均衡语料库,收录了包含书籍、杂志、报纸、白皮书、博客、网络论坛、教科书、法律等各领域在内的1亿430万余词。本文所使用的检索软件是中纳言(https://chunagon.ninjal.ac.jp/bccwj-nt/search)。检索时中纳言会从语料库所涵盖的领域中随机抽取包含检索关键词的语句。
通过检索,并选取前50句样本例句考察“ちょっと”词义的实际使用情况。以《小学馆日中词典》的词义分类为准。统计结果如图1。
![](//html.hanspub.org/file/26-2911808x7_hanspub.png?20230307084720061)
Figure 1. The frequency of occurrence of each word meaning in sample sentences
图1. 样本例句中每种词义出现频次
其中词义6和词义7是词典中5个词义所不适用的词义。如“食べるのはちょっと……”中表示省略和转折的用法,以及“ちょっと話せないけど”中表示拒绝的用法。
数据显示,50个语句样本中,词义②所使用的频率最高为36次,占比72%,词义①为8次,占比16%,词义③为2次,占比4%,词义④为3次,占比6%,词义⑤出现次数为1,占比2%。使用频率最高的是词义②,其次是词义①、③、④、⑤。词义②的使用频率远高于词义①的使用频率,高出52%。
3. “ちょっと”在机器翻译中的译文状况及分析
笔者把语料库中抽取的50个语句分别放入有道翻译和谷歌翻译在线进行翻译,并考察翻译结果状况。判断分为三类。第一类是正确,翻译软件对于句中所含有的“ちょっと”一词词义翻译正确,并且译文用词搭配正确;第二类是模糊,翻译软件对于句中所含有的“ちょっと”一词词义选择类别正确,但与译文用词搭配不正确,或是句义和原文要表达的意思不相符合;第三类是错误,翻译软件对于句中所含有的“ちょっと”一词词义选择类别错误,或对“ちょっと”一词漏译。
基于以上判断标准,笔者对机器翻译出的语句做出判断和统计。如表2,图2,统计显示有道翻译软件关于“ちょっと”一词的翻译正确的语句为34句,占比68%;模糊语句为7句,占比14%;错误语句为9句,占比18%。谷歌翻译软件关于“ちょっと”一词的翻译正确语句为22句,占比44%;模糊语句为6句,占比12%;错误语句为22句,占比44%。关于“ちょっと”一词的翻译,有道翻译正确率高出谷歌翻译24%,错误率低于谷歌26%。
![](Images/Table_Tmp.jpg)
Table 2. The comparison of the proportion of machine translation translation results
表2. 机器翻译译文结果比例对比
![](//html.hanspub.org/file/26-2911808x8_hanspub.png?20230307084720061)
Figure 2. The translation status of Youdao translate and Google translate
图2. 有道翻译和谷歌翻译的翻译状况
3.1. 正确译文
虽然机器软件在翻译时没有人类复杂的思维、丰富的感情,译出的句子多比较生硬,但是随着机器翻译技术的不断革新,机器翻译也出现了比较出色的译文。
例句1
原文:兄はちょっと外国人なまりのある調子でこう言いました。
人工翻译:哥哥用略带外国人口音的调子说道。
有道翻译:哥哥用略带外国人口音的语气这么说。
谷歌翻译:我的兄弟用略带外国风格的口气说。
分析:关于语料库的这个语句,两个翻译软件对“ちょっと”一词的翻译都是正确的、并且语句通顺、流畅。此处“ちょっと”表示“稍微”,修饰“ある”(有)的程度,直译为“稍微带有”,机器翻译对其进行了处理,输出了译文“略带”。软件筛选出了较妥当、合理的用词,使语句更加通顺。
3.2. 模糊译文
笔者首先是找到了有道翻译和谷歌翻译译文语句都是模糊的句子。其中翻译软件对“ちょっと”一词的语义选择正确,但给出的译文句义存在错误。
例句2
原文:あと百メートルちょっとで終点、という最後の最後に、わざわざごていねいにもう一度川を渡っていた。
人工翻译:还有一百米多一点就到终点了,它却在这最后的最后,特意很小心的又跨过了一次河。
有道翻译:还有一百多米就到终点了,在这最后的最后,我特意再一次小心翼翼地过江。
谷歌翻译:最后,距离一百多米远,我很麻烦再次过河。
分析:该语句中“ちょっと”用来修饰“百メートル”,意思为第②种词义“(量や程度が)一点,有点,一些,稍微”,译为“一百米多一点”。两个翻译软件对“ちょっと”词义的判断都是正确的。但是在前后搭配以及译文处理的时候出现了错误。
3.3. 错误译文
观察语句样本,找出有道翻译和谷歌翻译都出现错误的句子,并分析两个翻译软件都出现错误的原因。
漏译:
例句3
原文:自分と妻がちょっと言い争いをするのを聞いてもたちまちZ君が介入する。
人工翻译:小Z听到我和妻子发生了轻微争执后立马过来介入。
有道翻译:听到自己和妻子发生争执,小Z马上就介入了。
谷歌翻译:Z-kun听说他和他的妻子吵了一架后便介入。
分析:这个例句中“ちょっと”修饰“言い争いをする”,表示“轻微发生争执”、“发生小争执”。两个翻译软件都未译出“ちょっと”一词,出现了漏译。
误译:
例句4
原文:食べるのはちょっと……
人工翻译:吃,有些……
有道翻译:吃点……
谷歌翻译:有点吃……
分析:这个例句中,“ちょっと”表示省略和转折的含义。两个翻译软件均出现了误译。有道翻译把“食べるのは”这个名词化短语仍然判定成了动词“食べる”。而谷歌翻译的把语句词语的前后顺序颠倒了,颠倒后的中文译文语句是不通顺的。
通过对抽取的50个语句的机器翻译软件译文结果进行统计。有道翻译正确率(68%)较谷歌翻译(44%)高出24%,有道翻译错误率(18%)较谷歌翻译(44%)低26%。有道翻译整体表现远比谷歌翻译正确率高。
通过错误例句分析,笔者发现译文错误主要分为两类:漏译和误译。两类错误统计结果如表3。
![](Images/Table_Tmp.jpg)
Table 3. Comparison of missed translations and mistranslations between Youdao translate and Google translate
表3. 有道翻译和谷歌翻译的漏译和误译对比
根据图表显示,两种机器翻译软件中漏译错误占比和误译错误占比几乎接近。并且漏译错误占比都超过77%,漏译是两种机器翻译软件译文错误最主要的错误。
图3和图4为有道翻译和谷歌翻译每种词义翻译状况统计表。把语料库样本语句分别按照7种词义做了分类,并判断两种翻译软件的翻译情况。
![](//html.hanspub.org/file/26-2911808x9_hanspub.png?20230307084720061)
Figure 3. Youdao translation software’s translation statistics for each word meaning
图3. 有道翻译软件的每种词义翻译状况统计表
![](//html.hanspub.org/file/26-2911808x10_hanspub.png?20230307084720061)
Figure 4. The statistical table of the translation status of each meaning of Google translate software
图4. 谷歌翻译软件每种词义翻译状况统计表
4. 结语
针对暧昧词汇“ちょっと”的释义,本文选取了三个词典《小学馆日中词典》、《三省堂超级大辞林》和《广辞苑(第六版)》进行考察,并分析三个词典词义解释的异同。发现,三个词典中“ちょっと”都有5个词义,有4个词义高度相似,1个词义近似。通过对语料库中抽取的50个样本语句分析,发现“ちょっと”的语义使用频度中②词义:“(量や程度が)一点,有点,一些,稍微”最高,远超其他4种词义,占比72%。
关于“ちょっと”的翻译,机器翻译有表现出色的情况,译文用词恰当、准确。也存在译文模糊的情况。译文模糊的语句中,翻译软件词义选择正确,但译文词语搭配出现了错误。译文错误的情况中,两个翻译软件的漏译占错误比例都超过77%,远超误译比例55%,为译文错误的主要原因。笔者将机器翻译的译文结果分为三类,分别为正确、模糊和错误。有道翻译正确率(68%)较谷歌翻译(44%)高出24%,有道翻译错误率(18%)较谷歌翻译(44%)低26%。
由于篇幅和时间有限,本文仅考察了50个例句和两个翻译软件。希望接下来能增加样本例句数量并对更多的翻译软件做出考察。
参考文献