谷歌宣布在谷歌翻译中发布英语到西班牙语、芬兰语、匈牙利语和波斯语到英语的性别翻译,通过重写或后期编辑最初的翻译,利用一个新的范例来解决性别偏见。这家科技巨头声称,这种方法比之前支持谷歌Translate将性别特定性的土耳其语翻译成英语的技术更具可扩展性,主要是因为它不依赖于数据密集型的性别中立检测器。
谷歌Research的高级软件工程师梅尔文·约翰逊写道:“自从我们最初推出以来,我们已经取得了显著的进步,我们提高了针对性别的翻译质量,并将其扩展到另外4对语言。我们致力于进一步解决谷歌翻译中的性别偏见,并计划将这项工作扩展到文档级翻译。”
正如约翰逊所解释的,旧的分类器用于突厥语到英语的性别特定翻译,这是很难适应新的语言产生,以产生阳性和阴性翻译独立使用神经机器翻译(NMT)系统。此外,在多达40%的符合条件的查询中,它没有显示针对性别的翻译,因为除了与性别相关的现象外,这两种翻译通常并不完全相同。
相比之下,基于重写的新方法生成初始翻译,然后对其进行审查,以确定在哪些情况下,性别中立的源短语生成了性别特定的翻译。如果是这样的话,一个句子层次的改写器就会产生一个不同性别的翻译。最后,对原文和改写后的译文进行审查,以确保唯一的区别是性别。
根据谷歌,构建一个改写器涉及生成数百万个由词组对组成的训练示例,每个词组都包含阳性和阴性的翻译。因为这样的数据不是很容易获得,谷歌翻译团队通过将性别代词从阳性转换为阴性来生成候选改写,或者相反,从大量的单语数据集开始。对于这个新的重写语料库,他们应用了一个内部的语言模型,对数百万个英语句子进行训练,从中挑选出最好的候选词,从而获得从阳性输入到阴性输出的训练数据,反之亦然。
在合并来自两个方向的训练数据之后,团队使用它来训练一个基于单层转换的序列到序列模型。然后,他们在训练数据中引入标点符号和大小写变体,以增强模型的鲁棒性,从而使最终的模型能够在99%的情况下可靠地生成所要求的阳性或阴性重写。
评价小说谷歌度量称为减少偏见,衡量之间的相对减少偏见新的翻译系统和现有系统(“偏见”被定义为一个性别选择在翻译中未指定的源),约翰逊说,新的翻译方法导致的偏见减少90%来自匈牙利、芬兰和Persian-to-English。现有的突厥语-英语翻译系统的偏差减少率从60%提高到95%,该系统引发的性别差异翻译的平均准确率为97%(即(例如,当它决定显示性别特定的翻译时,97%的正确率)。
