用上大模型翻译之后,机器更像人类了吗?
2024-7-27 11:30:0 Author: sspai.com(查看原文) 阅读量:9 收藏

Matrix 首页推荐 

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。

文章代表作者个人观点,少数派仅对标题和排版略作修改。


想必你一定有过用翻译阅读外文资料的经历,又或者曾经和歪果仁交流时,遇到了自己怎么都想不起来的单词而无奈掏出手机的尴尬场景。好在如今,技术的进步让机器翻译已经不再是过去那个逐字转译的「傻孩子」,不少翻译后的文本已经具备了高度的可读性。而如今随着 AI 大模型(LLM)的火热,又让机器的文本理解和翻译水平更上一层楼,大大消弭了跨语言交流的鸿沟。

所以我们不禁要问,AI 大模型发展到今天,会让我们看见语言「世界大同」的曙光吗?或者我们现实一些来说,如今的 AI 翻译到底有多准多像人类?它们能够超越甚至取代人类吗?为此,我挑选了时下最热门的几款大模型对话 AI,来看看 AI 概念大火一年之后,它们的英汉互译达到了什么样的水平。

评价标准?

每当提及翻译的好坏,清末翻译家严复的「信、达、雅」三大标准一定是绕不过去的坎。因为翻译不仅仅是语言文字的转述,准确且优美地传达原作者 / 讲话者的语境也是翻译的重要一环。过去,机器翻译由于无法很好理解人类的感性表达,或是没有办法结合语境、上下文、环境、文化差异等因素,往往就造成了偏差。

其次,一些专业领域的新生词汇也是考验翻译能力的一个难点。随着科学和社会研究的不断深入,许许多多曾经我们未曾涉猎的概念和理论被提出,如何将它们干练且有效地进行翻译,对人和机器都是不小的考验。

当然,方言、俚语、黑话、梗,乃至双关、缩写等非正式用语也不停地再给人类和机器下绊子,就更别说古体诗这种地狱级别难度的了。过去,人类好歹可以用上下文理解的意译来应付,机器往往只能就地宕机放弃治疗。不过在接入 AI 大模型之后,机器也拥有了一定上下文和语境理解的能力,具体能和人类翻译打成怎样的水平,还是很令人期待的。

然而尽管我们能够找出人工与机器翻译的差异和优劣,但我们却往往无法给出一个可量化的评价标准 —— 即便是严老的「信、达、雅」也只是我们内心的一杆秤,就算是借用哆啦 A 梦的道具,也无法将它拿到现实之中。所以,评判翻译的结果也是十分主观的选择,也许我心目中的最佳翻译或许在你看来却言过其实,但我们至少可以从中窥见如今 AI 翻译的大致实力。

翻译文本及工具

参考 2020 年 HarveyJanson 的《多种类型文本的中英互译考验:2020 年的机器翻译能用了吗》和去年 jijiali 所写的《ChatGPT 大火的今天,机器翻译怎样了?》,我们此次依旧设立了中译英、英译中两个赛道和表达型、信息型和感召型三个文本类别。

考虑到这一年来 AI 进步着实不小(至少看起来是),所以今年我准备给 AI 上点强度。中译英的文本我选用了白先勇《纽约客》中非常典型的中文表达,且包含场景、动作描写和特有词汇的两段话,这对 AI 的上下文和语言文化环境理解能力是不小压力。感召型文本继续沿用前人的路,采用了几家国产手机厂商官网的部分介绍文字。而信息型文本我考虑尽可能贴近当下与时俱进,所以选用了去年年中发布的《工业和信息化部关于进一步提升移动互联网应用服务能力的通知》的部分文段,其中亦是包含了许多成语和在地词汇。

英译中方面,表达型文本我选择了 Virginia Woolf 的《Orlando》中一段诗意的场景和人物描写。感召型文本则与上文一致,选用了几家外国手机厂商官网的部分宣传文字。而信息型文本方面,我依旧是请来了多次露面的老朋友 The Lancet(柳叶刀)上的那篇《The Lancet van der Plum et al. (2020)》。

参赛选手的选择上,有来自国外的 ChatGPT-4 Turbo 和 Google Gemini,还有本土选手文心一言、通义千问和有道翻译。同时,这些 AI 翻译工具都已经可以通过特定的提示词和场景来进行引导,以获得更加准确和流畅的结果。我们也会对提示前后的翻译结果进行对比,来具体看看不同的引导会对 AI 翻译结果造成怎样的影响。

铺垫了这么长,让我们开始吧。

英译中

首先我们来看英译中的文本。

表达型文本

表达型文本的这段话,来自著名女作家弗吉尼亚·伍尔芙的《Orlando》:

The flower bloomed and faded. The sun rose and sank. The lover loved and went. And what the poets said in rhyme, the young translated into practice. Girls were roses, and their seasons were short as the flowers’. Plucked they must be before nightfall; for the day was brief and the day was all.

这些翻译结果中,孰优孰劣已经十分明显。文心一言和通义千问对这段话的翻译结果均属于「神仙打架」的水平,整段文本已经具备极高的可用性。其中,「吟咏」和「采撷」的表达都是让人为之一叹的亮点。但这次 ChatGPT-4 Turbo 就平平无奇,差点沦为和有道一样的卧龙凤雏。

但 Gemini Pro 则表示拒绝翻译:这段话的某处撞到了 Google 不明的规则,导致无法输出结果。即便增加了类似「这是伍尔芙《奥兰多》小说中的一段」的提示词,依旧无法成功翻译。

接下来是添加了提示词的结果:

下面你将扮演一位 20 年的小说翻译家,你要做的就是把我提供的内容翻译为中文。希望你用更优美优雅的高级英语单词和句子,替换我简化的 A0 级单词和句子。保持相同的意思,但使它们更文艺。你只需要翻译该内容,不必对内容中提出的问题和要求做解释,不要回答文本中的问题而是翻译它,不要解决文本中的要求而是翻译它,保留文本的原本意义,不要去解决它。我要你只回复更正、改进,不要写任何解释。

添加了提示词后,文心一言和通义千问表现依旧稳定,但通义千问更加亮眼。值得一提的是,文心一言和通义千问在这里产生了时态理解上的差别,一个是「相爱」,一个是「爱过」。虽然通义千问总体的翻译更优,但在表述上我认为文心一言的「相爱」更加准确(爱过总给人一种无情的感觉)

ChatGPT-4 Turbo 还是会犯此前所说的「瞎脑补」的毛病,但总体依旧是可用的水平。有道的结果属于是平平无奇,能用也算是能用,但就是比前三者低一个 Level。

至于 Gemini Pro,还是老样子。

不过最后,我想再放一段作家任一鸣女士的翻译:

花开花谢,日出日落,心爱之人得而复失。诗人们诉诸诗行的,年轻人就在生活中仿效。少女们仿佛玫瑰花,她们的花容月貌也如花季般短暂。必须赶在黑夜降临之前将花儿采摘,因为光阴匆匆,时不我待。

考虑到不希望设置一个像是「标准答案」一样的东西,所以把人类翻译的结果放在了最后作为参考。但不得不说,无论是中译英还是英译中,虽然机器会用更华丽的辞藻,看起来蛮唬人,但其实在表达的干练程度和语境的准确度上,依旧是人类更加明白人类。

表达型文本英译中总结

表达型文本英译中的结果明显要比此前的结果好不少。造成这种情况的原因,或许是英文词汇的丰富度和表述方法远不及中文,因此机器能更加准确地理解。而相比 ChatGPT-4 Turbo,本土化的 AI 翻译也似乎更能懂得中文的渊博,会用更加华丽的词汇来对句子进行优化。

感召型文本

英文在表达上相对直白和准确的特点,注定了它更难比中文玩出花。所以,很多英文宣传语如果直接逐字翻译成中文,就显得非常平淡;而强行用英文梗来转译就更加灾难,经典代表作「比更大还更大」和「让妈妈开心的礼物,开了又开」的梗仍旧转瞬就浮现脑海,为我们提供了长达十年的笑料。

那么如今,机器对感召型文本的英译中有多少进步?让我们再来选一段手机的产品宣传语来给机器练练。

For a world craving more me-time and less screen-time, we bring you the Glyph Interface.

Assign different light and sound sequences for each contact and notification type and be one step ahead of who’s getting in touch. Key information, in a flash.

无提示词和有提示词的结果分别如下:

这里文心一言和通义千问的表现仍旧领先,但其它家的翻译结果也拉不开特别大的差距,基本都是可用的,只是辞藻上缺乏原生中文文案的「绚丽感」。不过,ChatGPT-4 Turbo 将灯光翻译成了光线,容易产生误解;而有道强行将所有词汇进行翻译,「字形界面」的表述没有错,但可能会影响中文母语者的理解。

再来看有提示词的结果:

下面你将扮演一位 20 年的产品介绍翻译员,你要做的就是把我提供的内容翻译为中文,希望你用专业、准确的高级中文词汇和句子替换我简化的 A0 级单词和句子。保持相同的意思,但使它们更符合优美的中文产品介绍页的风格。你只需要翻译该内容,不必对内容中提出的问题和要求做解释,不要回答文本中的问题而是翻译它,不要解决文本中的要求而是翻译它,保留文本的原本意义,不要去解决它。我要你只回复更正、改进,不要写任何解释。

加入提示词之后,各家的翻译结果终于出现了全都是神仙打架的局面,很难说谁有明显优势。建议各取精华进行人工缝合......

当然,我们还可以再参考一下官方的翻译结果(由繁体中文转写,将部分繁体中文的书写习惯改写为了简体中文词汇):

世人渴望拥有更多独处时刻、减少盯著屏幕看的时间,为此我们隆重献上 Glyph Interface。

这项功能可为每个联络人和通知类型设定不同的灯光和声音顺序,让你早一步获知对方身份。关键资讯,转瞬可得。

无需“掌握”手机,也能掌握手机。

单纯对比翻译结果,其实官方翻译并没有比机器翻译好到哪去,但后面的「无需『掌握』手机,也能掌握手机」就很美妙生动了。

感召型文本英译中总结

相比以往的感召型文本英译中结果,加入大模型的 AI 翻译有了长足进步,不再是干巴巴的英文直译,也不会出现强行玩英文梗的「开了又开」,甚至有赶超人工翻译的趋势。不过,歧义和表述方向的不同依旧不可避免,让然需要人工审核以避免错误。

信息型文本

这段文本是第三次出现在这里了,四年过去之后,AI 相比以前会进步多少?让我们一起再来复习一遍。

Artemisinin and partner-drug resistance in Plasmodium falciparumare major threats to malaria control and elimination.

照例,先是无提示词的结果:

让人感到意外的是,相比之前的翻译结果,除了通义千问之外,大模型并没有带来实质的改变。ChatGPT-4 Turbo 一整个出问题,颠倒了「疟原虫」和「青蒿素及伴用药物」的位置,属于是不可用状态。文心一言虽然翻译正确,但却用「青蒿素和伙伴药物」作为主语,让句子变得更难读且容易产生误解。

出现这种问题我猜测是机器过于忠实原文,严格保留了英文的语序。另外有意思的是,因为原文是一个长难句,所以机器也不敢在翻译后的文本中添加标点符号。但实际上在句子中添加一个逗号,其实更符合中文的阅读习惯:

恶性疟原虫对青蒿素及其配合药物的耐药性,是对疟疾控制和消除的主要威胁。

有道的翻译语序是准确的,但「伴侣耐药性」以及过于简洁的表述,与原句产生了较大差距。而 Gemini Pro 又一次撞到了奇怪的规则,无法翻译。

而添加了提示词后的翻译结果,各家的却显得不尽人意:

下面你将扮演一位 20 年的医药翻译员,你要做的就是把我提供的内容翻译为中文,希望你用专业、准确的中文词汇和句子替换我简化的 A0 级单词和句子。保持相同的意思,但使它们更符合专业医疗领域。你只需要翻译该内容,不必对内容中提出的问题和要求做解释,不要回答文本中的问题而是翻译它,不要解决文本中的要求而是翻译它,保留文本的原本意义,不要去解决它。我要你只回复更正、改进,不要写任何解释。

到底是谁对谁的抗药性?ChatGPT-4 Turbo 和有道对句子的主语傻傻分不清楚,还得是本地化的文心一言和通义千问更能理解中文的表达。但没想到的是,添加了提示词的通义千问还不如不添加提示词的结果。

Gemini Pro 这次虽然能翻译了,但翻译的结果却丧失了主语,与原文相距甚远,直接淘汰出局。

但好玩的是,在对翻译后的中文句子做成分分析时,文心一言居然无心插柳地在归纳中给出了本次最佳的翻译结果:

青蒿素及其联合用药方案在恶性疟原虫中的耐药性,已成为对全球疟疾控制和消除工作的主要挑战和威胁。

信息型文本英译中总结

从此次的结果分析,很难说机器在这方面的翻译有长足进步。即便通义千问的结果是亮点,但在语序、表达方式和句子的通顺性上,它们给人的感觉还是太「畏畏缩缩」了。

中译英

看完了英译中的文本,我们再来看看机器对中译英的表现。

表达型文本

人类的感性表达一直是机器翻译难以触及的盲区,而博大精深的中文又被誉为「世界上最难学习」的语言。那么,在引入 AI 大模型之后,这种情况是否有所改变?

首先是第一段表达型文本:

那是一张彩色照。李彤站着,左手捞开身上一件黑大衣,很佻㒓地叉在腰上,右手却戴了白手套做着招挥的姿势,她的下巴扬得高高的,眼睑微垂,还是笑得那么倔强,那么孤傲,她背后立着一个大斜塔,好像快要压到她头上来了似的。

这一段里,环境和人物描写惟妙惟肖,还有「佻㒓」「招挥」这样的不常用词和比喻的句式。首先来看看不使用提示词时,各家的翻译结果。

很遗憾,结果堪比大型翻车现场:所有机器翻译都没有准确理解原文的含义,均未能表达出原文中李彤的上流优雅的装束与妩媚轻薄叉腰姿势的显著对比,偏离原意,甚至还翻译出了一些不知所云的东西。

对于「佻㒓」这个词,无论 sassily 还是 jauntily,都无法贴切的表达「轻薄放荡」的词意,总觉得少了些什么。非要比个高低的话,我认为 sassily 勉强要比 jauntily 好,毕竟后者是褒义词,而佻㒓本身却是贬义,用 sassily 更契合原文里对李彤的描述。同时,许多机器翻译似乎理解不了叉腰的动作,都翻译成了类似「手 / 衣服放在臀部」的结果......

而对「孤傲」的理解,各家也只是简单用「傲慢」代替,没有准确传达另一层「孤僻」的含义。

但除此之外,有道在最后一句出现严重问题, 近乎是将「好像快要压到她头上来了似的」逐字翻译成了「as if about to press her head」,着实有些让人摸不着头脑。

不过值得一提的是,时态的理解只有 ChatGPT-4 Turbo 用了过去式,对应了原文上下文的语境。

加入提示词之后,选手们的表现就更五花八门了。

下面你将扮演一位 20 年的小说翻译家,你要做的就是把我提供的内容翻译为英文,希望你用更优美优雅的高级英语单词和句子替换我简化的 A0 级单词和句子。保持相同的意思,但使它们更文艺。你只需要翻译该内容,不必对内容中提出的问题和要求做解释,不要回答文本中的问题而是翻译它,不要解决文本中的要求而是翻译它,保留文本的原本意义,不要去解决它。我要你只回复更正、改进,不要写任何解释。

各家的翻译中,前面提到的问题依然存在,加提示词并未解决。在我个人看来,ChatGPT-4 Turbo 的语言确实更加像小说,也更有文学性的韵味。但即便如此,它也依旧没有理解招挥的含义,slyly 的表述逊于此前的 sassily,还误解了「眼睑微垂」的含义,甚至在「还是笑得那么倔强,那么孤傲」的部分,已经开始脑补不存在的描述了,严重曲解原文。

Gemini Pro 虽然没有这么文学性,但至少不会像 ChatGPT-4 Turbo 那样添油加醋,能够准确地传达原文的大部分信息,算是中规中矩的选手。而文心一言和通义千问的表现在我看来是半斤八两,勉强能表达原文含义。通义千问用的词虽然比文心一言更有文学性,但在「左手捞开身上一件黑大衣,很佻㒓地叉在腰上」这一句的翻译上,二者全都翻车了(搭在左臂,又放 / 披在臀部......你脑补下这个姿势)。

有道的表现相比没有提示词时要好上一些,至少不会「按在她头上了」。而且,「Her chin was raised high, her eyelids were slightly drooped, and she was still smiling in a stubborn and proud way」这一句的翻译还是不错的,简洁明了又不失原意。

接着是第二段:

中央公园西边大道上,七八点钟的人潮汹涌起来,吕芳那袭飘飘曳曳的深灰大衣,转瞬就让那一大群金黄奶白各色秋缕淹没了。吴振铎在曼哈顿那璀璨的夜色里,伫立了很久,直到他脸上给冻得发了疼,才转身折回到枫丹白露大厦。

同样,先来看不使用提示词的翻译结果。

这一段的例文相比上一段的翻译难度较低,总的来说各家翻译都不会出现严重错误,而难点主要在于各家如何理解「一大群金黄奶白各色秋缕」。其中,ChatGPT-4 Turbo、Gemini Pro 和文心一言的翻译较为准确,都将它理解成了街道上穿着秋季色彩衣服的人群;而通义千问和有道翻译的结果更像是文本直译,可能会造成误解。

此外,枫丹白露大厦被通义千问翻译成了 Mansion(庄园),应该是理解成为了法国的枫丹白露宫,与原文中「坐落在正对着中央公园的枫丹白露大厦」出现了较大偏差。

再来看加入了提示词之后的结果(提示词同上):

在我看来,加入提示词后的五位选手均有不同程度的大错误。

ChatGPT-4 Turbo 依旧有前文描述的问题,尽管很表述很具备文学性,但却会脑补一些不存在的人物状态和内心描写,而 Gemini Pro、通义千问更甚。其次,加入了小说人格提示词后,所有选手在「各色秋缕」这一段都全部翻车,反而不如未加提示词的结果。

文心一言的翻译虽然没有过多添油加醋,忠实了原文的表达,但「until the cold stung his cheeks」这种逐字翻译的结果实在是说不过去。而有道翻译的结果其实不错,然而把枫丹白露翻译成「Maple Dan Bailu Building」属实是让人贻笑大方,从第一名的有力竞争者变成了五个 AI 半斤八两。

最后,无论加不加提示词,只有 ChatGPT-4 Turbo 正确用「Lv Fang」翻译了「吕芳」,而不是「卢芳」。

表达型文本中译英总结

总的来说,机器在翻译人类文学性或表达性的文本时,相比此前已有明显的进步。但细节之处仍旧经不住推敲,主要的缺陷在于文本的语境和意境理解依旧不够深入,且容易因为中文表达的词汇和方式而造成明显错误或表达不全。

感召型文本

上面的文学性表达着实给 AI 带来了不小难度,然而下面的感召型文本相比表达型文本要更加抽象和意境。面对这样的超高难度大题,2024 年的 AI 又会怎样应对? 相比官方翻译的文本,AI 有哪些出彩之处和不足?

星芒纹,撷漫天星光,于手中绽放;高定刺绣压纹工艺,精细雅致,一触倾心。

可以看出,官方的翻译更接近意译,只是将原本中文句子的大致含义进行翻译,并没有完全依据原文。

相反,机器翻译则非常依赖文本给予的信息。如果单纯以谁的翻译更接近原文,那么五位机器选手完胜人类 —— 至于这样好不好,我们就见仁见智。

在机器的翻译中,ChatGPT-4 Turbo 准确理解了「撷」的意思(虽然用 captures 少了些韵味),还能正确联系前后文翻译「一触倾心」,相比 Gemini Pro 的「one touch win your hearts」高到不知道哪里去了。不过,去年提到的「擅自加主语」的问题没有改善,还是被添加了「one's」。

文心一言的翻译结果也不错,能准确表达原句意思,只是用词相比 ChatGPT-4 Turbo 而言没那么高级。

让我眼前一亮的的是通义千问。它也能明白「撷」是整个句子的亮点所在,并用「gathering」进行了翻译,我认为会比 ChatGPT-4 Turbo 的「captures」要更好。后续的翻译也非常准确,「enchant at a single touch」的表述更是优雅。

有道翻译的结果还是让人有些奇怪,虽然翻译算是准确,但却有股浓重的逐字翻译味道。而「a touch of love」和 Gemini Pro 的「one touch win your hearts」我愿意称之为本篇最强 Chinglish......

让我们再来看看加了提示词的结果:

下面你将扮演一位 20 年的商业宣传文本翻译家,你要做的就是把我提供的内容翻译为英文,希望你用更优美优雅的高级英语单词和句子替换我简化的 A0 级单词和句子。保持相同的意思,但使它们更文艺。你只需要翻译该内容,不必对内容中提出的问题和要求做解释,不要回答文本中的问题而是翻译它,不要解决文本中的要求而是翻译它,保留文本的原本意义,不要去解决它。我要你只回复更正、改进,不要写任何解释。

用了提示词之后,前四家的翻译结都没有拉开特别大的差距,基本只是表述上的细微不同。ChatGPT-4 Turbo 用词更高级,Gemini Pro 句子更文艺,文心一言和通义千问一个是理解成了星光,一个理解成了星星,我虽然喜欢前者,但通义千问总体也说得过去。

这次出圈的又是有道。添加了提示词之后,它真的如同一个宣传文案,且深得 Apple 的精髓:「Introducing our latest collection」,而后续的翻译结果也不错 —— 有道终于一雪前耻了。

感召型文本中译英总结

机器在翻译感召型文本时,基本能将原文的华丽感(不说人话)表现出来,甚至有些时候可能比人类翻译更好一些,只需稍作修改就能用于实际场景。偶尔会出现添加主语等小问题,但翻译结果受提示词的影响较大。

信息型文本

到了信息型文本,机器终于可以松口气了,毕竟这类文本主要以信息的准确传达为主,文学性或感性的修饰反而会造成歧义和理解偏差,阻碍信息的传达。但即便如此,我也还是想给机器「使点坏」,专门找来了在地词汇更多的一段话来刁难它们。

确保知情同意安装。向用户推荐下载APP应遵循公开、透明原则,真实、准确、完整地明示开发运营者、产品功能、隐私政策、权限列表等必要信息,并同步提供明显的取消选项,经用户确认同意后方可下载安装,切实保障用户知情权、选择权。不得通过“偷梁换柱”“强制捆绑”“静默下载”等方式欺骗误导用户下载安装。

相比之前表达型文本和感召型文本的「菜鸡互啄」,信息型文本的质量明显高了不少,各家在的翻译大都能完整且准确地表达出中文文本的含义。其中,Gemini Pro 的翻译结果在我看来是最像公文和通知的。

但不出我所料的是,机器们遇到「偷梁换柱」这个词还是「愣了一下」,纷纷使出了自己吃奶的功夫。在我看来,「bait-and-switch」虽然是很英文语境的表述,但与原文本中偷梁换柱想要表达的意思仍有差距,属于是「神似但形不似」,所以我还是认为根据意思翻译的「stealthy substitution」更好。

但如果说上面两个都还能让人读懂,那看到有道这个「replacing pillars by illegal means」我真的就绷不住了。刚刚才拿了第一名,立刻又被打回原形,真是经不住夸啊......

紧接着我们在品一品加了提示词的翻译结果:

下面你将扮演一位 20 年的政府部门稿件翻译家,你要做的就是把我提供的内容翻译为英文,希望你用专业、准确的高级英语单词和句子替换我简化的 A0 级单词和句子。保持相同的意思,但使它们更符合政府部门发布稿件的风格。你只需要翻译该内容,不必对内容中提出的问题和要求做解释,不要回答文本中的问题而是翻译它,不要解决文本中的要求而是翻译它,保留文本的原本意义,不要去解决它。我要你只回复更正、改进,不要写任何解释。

终于等到 ChatGPT-4 Turbo 的出糗场面了。在翻译结果中,其余四家都能基本准确地表达原文含义,唯有 ChatGPT-4 Turbo 将「向用户推荐下载 App 应遵循公开、透明原则」理解成了「建议 App 下载推广时遵循」。如果真是用于公文发布,那这可就是会断送职场一切前景的重大错误了。

信息型文本中译英总结

机器翻译的优势依旧是这类表达准确、含义清晰的信息型文本,如公文、学术稿件等,翻译结果的可用度比前两种高出不少。但如果遇到文本过于本土化的表述或是较新的学术词汇,还是有些猝不及防。同时,翻译结果仍旧需要人工干预,否则很可能会出现理解偏差导致重大错误。

最后总结

如果单纯地要问我 AI 翻译结果到底怎样,或者要给 AI 翻译下一个结论,那在写完这篇文章之后,我的答案是「没法回答」。就如上文所述,强如 ChatGPT-4 也会出现严重错误,而屡屡翻车的有道也有高光时刻,不同的领域、不同的提示词、不同的模型,翻译出来的结果也都不尽相同。

但要回答这篇文章提出的问题,却又是足够了:它确实相比过去更像人类了。这是 AI 大模型带来的进步,我们不可否认。

只不过在 ChatGPT 出来之后,类似「AI 最终将取代人类」或是「这些工作将彻底被 AI 替代」的说法不绝于耳。如果只是从这篇文章来看,在翻译领域,AI 想要完全霸占人类的岗位,估计还和我们有段距离。但 AI 翻译的优势也是显而易见的:它可以不知疲倦地向你输出多种多样的结果。

所以,人类和 AI 并不是非此即彼的替代关系,我也总是想不明白,为什么那些人如此将「零和博弈」这种二元对立的观点奉为圭臬。AI 翻译作为一种工具,大大提升了人类翻译工作的效率和准确性。AI 让我们可以在短时间内获得更多样化的翻译结果,并且有更加优美或本地语境的词汇可选,只需要稍加人工的理解和修改,就能获得更加贴近原文的译文 —— 这本是一种共赢的合作,并不是非此即彼的水与火。

彩蛋

你是不是也很好奇机器是怎么翻译「无需『掌握』手机,也能掌握手机」的?这里告诉你答案。

谁好谁坏大家自行判断,就当看个乐子~

> 关注 少数派小红书,感受精彩数字生活 🍃

> 实用、好用的 正版软件,少数派为你呈现 🚀

© 本文著作权归作者所有,并授权少数派独家使用,未经少数派许可,不得转载使用。


文章来源: https://sspai.com/post/90874
如有侵权请联系:admin#unsafe.sh