爱吧机器人网 » 专题 > 观点 > 正文

人工智能真的可以取代同传翻译吗?

前阵子,一位同传翻译员声讨科大讯飞“AI同传造假”,在网上引起了轩然大波,人工智能和同传翻译由此成为大家热议的话题。今天,我们来谈一谈“人工智能翻译是否真的可以取代同传翻译员”?
 
人工智能真的可以取代同传翻译吗?

同声传译有多难?

同声传译最早出现在一战后的巴黎和会上,英法两国代表借助同声传译人员的帮助,完成了紧张的谈判。如今,该技术依然在国际会议上扮演着极其重要的角色。据统计,95%的国际会议都有专业同声传译人员助力。

同传翻译员在台上能够将同传能力运用自如,需要平时大量的艰苦练习,即使是双语运用自如的专业人员,在实战之前,也要进行数年的锻炼。他们不仅需要事先学习、熟悉会议资料,还需要随机应变的能力。同声传译的工作方式也比较特殊,因为压力巨大,一般多人协同,在一场数小时的过程中,每人轮流翻译几十分钟。

相较之下,普通的口译工作则要简单不少。机器翻译如能代替同声传译,无疑具有巨大的价值。

人工智能翻译的水平如何?

那么,人工智能同传翻译的能力究竟怎样?会不会抢走同传翻译员的饭碗呢?

今年上半年的博鳌亚洲论坛上,首次出现了AI同传。然而,现场配备的系统却掉了链子,闹出词汇翻译不准确、重复等低级错误。

客观来讲,人工智能或机器翻译技术在自然语言处理上,的确有许多突破。这些突破给人希望,让人畅想未来,但是,短期内的价值,更多体现在辅助翻译等领域。

当然,目前机器翻译已经取得非常大的进步,在衣食住行等常用生活用语上的中英翻译可以达到大学六级的水平,能够帮助人们在一些场景处理语言交流的问题,但距离人工同传以及高水平翻译所讲究的“信、达、雅”,还存在很大的差距。

目前的差距是由现有技术水平的限制决定的,机器翻译,又称为自动翻译,是利用计算机将一种语言转换为另一种语言,机器翻译技术的发展与计算机技术、信息论、语言学等学科的发展紧密相关。从早期的词典匹配,到结合语言学专家梳理的知识规则,再到基于语料库的统计学方法,随着计算能力的提升和多语言信息的积累,机器翻译技术开始在一些场景中提供便捷的翻译服务。

新世纪以来,随着互联网的普及,互联网公司纷纷成立机器翻译研究组,研发了基于互联网大数据的机器翻译系统,从而使机器翻译真正走向实用,市场上开始出现比较成熟的自动翻译产品。近年来,随着深度学习的进展,机器翻译技术得到了进一步的发展,促进了翻译质量的提升,使得翻译更加地道、流畅。

机器翻译的难点在哪里?

这里,简单介绍一下机器翻译的难点。整个机器翻译的过程,可以分为语音识别转换、自然语言分析、译文转换和译文生成等阶段。

在此,以比较典型的、基于规则的机器同传翻译为例(参见下图),模块包含了:语音识别(语音转换为文本)、自然语言处理(语法分析、语义分析)、译文转换、译文生成和语音生成等模块。其中的技术难点主要是:语音识别、自然语言处理和译文转换等步骤。

人工智能真的可以取代同传翻译吗?
第一个技术难点是语音识别。

近二十年来,语音识别技术取得了显著进步,开始进入家电、汽车、医疗、家庭服务等各个领域。常见的应用系统有:

  • 语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;
  • 语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;
  • 智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、旅行社服务系统、订票系统、银行服务等。
可以说,语音识别技术与其他自然语言处理技术相结合,可以构建出很多复杂的应用。

然而,语音识别的主要难点就是对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。由于语音信息量大,语音模式不仅对不同的说话人不同,对不同场景的同一说话人也是有差异的。

例如:一个人在随意说话和认真说话时的语音特征是不同的。另外,说话者在讲话时,不同的词可能听起来是相似的,这也是常见现象。单个字母或词、字的语音特性,受上下文的影响,以致改变了重音、音调、音量和发音速度等。最后,环境噪声和干扰对语音识别也有较大影响,致使识别率低。

第二个技术难点是语义解析,这是智能化的机器翻译系统的核心部分。

目前,机器翻译系统可划分为基于规则和基于语料库两大类。前者以词典和语言知识规则库为基础;后者由经过划分并具有标注的语料库构成知识源,以统计学的算法为主。

机译系统是随着语料库语言学的兴起而发展起来的。目前,世界上绝大多数机译系统都采用以规则库为基础的策略,一般分为语法型、语义型、知识型和智能型。不同类型的机译系统,由不同的成分构成。

抽象的说,所有机译系统的处理过程都包括以下步骤:对源语言的分析或理解,在语言的语法、语义和语用等平面进行转换,按目标语言结构规则生成目标语言。

当前,Google 的在线翻译已经为人熟知,其第一代的技术即为基于统计的机器翻译方法,基本原理是通过收集大量的双语网页作为语料库,然后由计算机自动选取最为常见的词与词的对应关系,最后给出翻译结果。

不过,采用该技术目前仍无法达到令人满意的效果,经常闹出各种翻译笑话。因为,基于统计的方法,需要建立大规模的双语语料库,而翻译模型、语言模型参数的准确性直接依赖于语料的规模及质量,翻译质量直接取决于模型的质量和语料库的覆盖面。

除了上述传统的方式,2013年以来,随着深度学习的研究取得较大进展,基于人工神经网络的机器翻译逐渐兴起。就当前而言,广泛应用于机器翻译的是长短时记忆循环神经网络。该模型擅长对自然语言建模,把任意长度的句子转化为特定维度的浮点数向量,同时“记住”句子中比较重要的单词,让“记忆”保存比较长的会话时间。该模型较好地解决了自然语言句子向量化的难题。

其技术核心是通过多层神经网络,自动从语料库中学习知识。一种语言的句子被向量化之后,在网络中层层传递,经过多层复杂的传导运算,生成译文。这种翻译方法最大的优势在于译文流畅,更加符合语法规范。相比之前的翻译技术,质量有较高的提升。

智能同传翻译离我们还有多远?

需要说明的是,很多人对机器翻译有误解,认为机器翻译偏差大。其实,机器翻译运用语言学知识,自动识别语法,模拟语义理解,进行对应翻译,因语法、语义、语用的复杂性,出现错误是难免的。就已有的成果来看,全场景通用的机器翻译,其翻译质量离终极目标仍相差甚远。

随着全球化网络时代的到来,语言障碍已经成为二十一世纪社会发展的重要瓶颈,实现任意时间、任意地点、任意语言的无障碍自由沟通是人类追求的一个梦想。这仅是全球化背景下的一个小缩影。在社会快速发展的进程中,机器翻译将扮演越来越重要的角色。

作者:沈春泽,苏宁金融研究院金融科技研究中心副主任,公众号:苏宁财富资讯

本文由 @沈春泽 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自网络



上一篇:「学习进行时」习近平谈人工智能
下一篇:百度王海峰:人工智能助力实体经济发展
精选推荐
英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

机器人工程师具体都做什么?
机器人工程师具体都做什么?

[2017-12-08]  机器人工程师是幕后设计师,负责创建机器人和机器人系统,能够执行人类无法完成或不愿意完成的任务。 通过他们的创造,机器人工程师帮助工作更安全,更轻松,更高效,特别是......

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

美国喷气推进实验室的AI驱动无人机挑战人类飞行员
美国喷气推进实验室的AI驱动无人机挑战人类飞行员

[2017-12-08]  随着无人机及其组件越来越小,效率越来越高,功能越来越强大,我们已经看到越来越多的研究开始让无人机自主飞行在半结构化的环境中,而不依赖于外部定位。 宾夕法尼亚大学在......

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

本周栏目热点

李开复:关于人工智能在中国异军突起的六大主要原因

[2017-11-07]  虽然世界各个国家都已经开始加速对人工智能行业进行布局,虽然世界各国都已经出台了各种政策表示对人工智能的支持,但是就目前的发展形势来看,中美两国在人工智能领域的发展......

[2018-02-05]  “人工智能国际主流学界所持的目标是弱人工智能,也少有人致力于强人工智能。那么,这是不是因为强人工智能‘太难’,所以大家‘退而求其次’呢?不然。事实上,绝大多数人工......

阿里研究院:关于互联网+制造业的10个观点(组图)

[2015-12-29]     互联网对商业环节的渗透和改造是逆向的,从与消费者最近的广告营销端开始, ...

2020年中国AI基础数据服务行业发展报告

[2020-04-03]  核心摘要:目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点, 需要大量经过标注处理的相关 ...

【业界观点】2016年工业机器人需求增速将放缓

[2016-01-19]     2015年中国工业机器人需求规模达到109亿元,同比增长16%,而2016年机器人需 ...