99YEE.CN
24小时在线专业翻译

机器翻译能帮你多少?行业数据趋势

作者:Memsource项目主管, Konstantin Dranch

2016年8月16日

云翻译平台的一个优点是数据集中。这就意味着可以俯瞰某些语言行业数据趋势,如机器翻译 ( MT ) 的用法及有效性。目前,“大数据”只是刚刚渗透进入翻译工具中,开发人员仍在学习如何使用它。我相信,未来所有的云工具都将会基于用户统计信息开发分析和预测功能,类似于自由职业市场Upwork那样在特定领域中,遴选出顶尖 10% 的自由职业者。然而,现在我们已经可以做的是发现有用趋势,证实假设,破除迷信。

作为一名研究人员,我很高兴在本年初将数据工具引入到了 Memsource 中。以下是一些我们努力收集的此行业数据集合中值得注意的信息。

机器翻译杠杆:只有 5-20% 的机器翻译结果是可以直接使用的

为了第一个研究,我和同事决定观测机器翻译,以评估它能在多大程度上帮助专业译者。行业研究机构调查指出,多达 30% 的翻译公司使用机器翻译。这点不难理解:目前税前利润如此之低,企业希望努力节省每一分成本,提升利益能力。同时,在很多翻译对话论坛中,译者集体抵制机器翻译的怒火足以融化键盘。

我浏览了收集到的数据,看它们是否可以为双方各自的主张提供支持。

分析显示,只有5-20%的原生机器翻译结果好得无需任何更改即可使用。多达40%的机器翻译结果,在经过编辑后可以使用,在80%的翻译语段中,机器翻译可以自动填充数据。

不同语言对的机器翻译利用率在上面的图表中(点击图片放大),匹配率表示译文和机器翻译引擎所给建议之间的相似性:

  • 匹配率 100%:专业人工翻译与机器翻译所给建议完全相同的语段
  • 匹配率 85-95%:机器翻译结果在编辑后足以采用。
  • 匹配率 50-75%:机器翻译对于单个字词的自动填充很有用,但不适用于整个语段
  • 匹配率 0 表示:语段与人工翻译结果的相关性只有 0-49%

请注意:只能跟踪用户首次启用机器翻译的项目,然后进行译后编辑之后再分析。这意味着,这里的样本约有 3800 万单词。

机器翻译在翻译法语、英语、西班牙语、葡萄牙语时可更好地发挥作用

数据结果表明,法语,葡萄牙语,西班牙语和英语机器翻译引擎具有最高的潜在机器翻译利用率。英译法的翻译质量尤其突出,其中超过 20% 的翻译是完全匹配机器翻译所给建议,几乎90%的语段与机器翻译结果有一定相似性。

相比之下,俄语,波兰语和韩语的利用率很低,模糊匹配低于 40%,甚至 20%,完全匹配只有 5%。

这种差异的出现可能和语言的类型分类有关。法语,葡萄牙语,西班牙语和英语是分析型语言,就是说这些语言依赖于词序以及例如“是”或“将”这样的辅助词来传达意思。另一方面,俄语,波兰语和韩语是综合型的,就是说这些语言更多地使用屈折变化。机器翻译仍然致力于处理那些细微差别。

32% 的项目使用机器翻译

12

正如在其他CAT工具中一样,在 Memsource 中,用户可以添加机器翻译引擎,以便在逐段浏览文本时快速获得参考译文。这个过程称为“交互式机器翻译译后编辑”,这与传统译后编辑的区别在于译者不必每段都使用机器翻译。如果机器翻译错误较多,他们就重新翻译。

在机器翻译引擎的选择上,译者通常使用通用引擎,比如谷歌翻译或微软翻译。因此,本研究首先针对此类引擎的翻译效果,而非对特定术语和主题领域进行微调的定制引擎的翻译效果。

如上所述,不是每个人都喜爱机器翻译。译者和语言服务公司认为,机器翻译有时会降低翻译质量或干扰译者的注意力和自制力,这样不利于译者追求完美的译文。Memsource 中只有约32%的项目启用了机器翻译。这个数字之所以有这么高,也是因为机器翻译的“开启”选项被设置为默认值。

报道显示,大约两年前,48% 的项目应用了机器翻译。从那时起,我们系统的平均翻译量已经从每月 1 亿字增长到 6-8 亿字,而机器翻译项目的份额却下降了。我预测,这意味着我们的译者用户群越来越能代表整个翻译行业。Memsource 曾是几个专业技术公司主导的翻译工具,如今用户遍布翻译领域。这有助于说明百分比下降的原因。

接下来会如何?

MT 使用量会增加吗?这是毫无疑问的。如今的在线对话需要快速翻译。与高质量相比,客户需要的是更快的周转时间。用 Facebook 的著名口号来说,就是“比完美更重要的是完成”。

与此同时,机器翻译的准确度在不断提高,然而仍然没有达到人类的水准,但它正在朝此方向进步。因此,也就有了更多关于启用机器翻译的争论。

以上内容是收集的数据中的一些发现。我们期待在未来几个月能分享更多!

九九译九九译 » 机器翻译能帮你多少?行业数据趋势

分享到:更多 ()

在线下单

文档翻译证件翻译