核心算法+GPU计算
所谓语音识别技术,就是把语音转换成文本,也称为自动语音识别。语音识别是人工智能领域极为重要的前沿技术。在美国政府关于限制发放签证的“Technology Alert List”中,语音识别赫然在列,与核武器、火箭技术等同在“黑名单”之中。
随着自然人机交互需求的扩大,个人智能助理渐渐成了各大巨头争夺的下一个入口,苹果Siri等是个人智能助理类典型应用。而语音识别则是人机交互的第一步。
据介绍,此次“人机大战”的语音识别算法主要基于BLSTM(双向长短时记忆神经网络),这种算法对单位时间内的计算量要求很高,因此阿里云采用了带GPU加速的新一代高性能计算平台,单节点计算能力达16 Tflops,并且对BLSTM算法做了针对性优化,实时解码更为顺畅。
走出实验室赋能应用
阿里云iDST智能语音团队拥有世界一流的专家团队,此次年会展示的研发成果只是冰山一角。实际上语音技术已经走出实验室,在阿里内部广泛应用,比如赋能阿里集团客服和蚂蚁金服客服团队的呼叫中心智能化。
去年双11,蚂蚁金服95%的远程客户服务已经由大数据 智能机器人 完成,同时实现了100%的自动语音识别。蚂蚁金服客户中心整体服务量超过500万人次,客服人员的精力可以更好地集中到处理复杂类客户问题和工作。
同时,语音团队还把智能语音交互技术赋能给YunOS以及手机淘宝、支付宝、钉钉等移动端应用。













