作为核心产品而言,Cue提到了四个组成: 语音识别 (理解你何时与它对话), 自然语言 理解(理解说话内容),执行(满足查询或请求)以及响应(产生回话)。“ 机器学习 对所有这些都有重要影响。”

Tom Gruber(上)与Alex Acero
Siri高级研发部主管Tom Gruber是在最初的收购后加入了 苹果 的,他表示,在 苹果 把 神经网络 用于Siri之前,其用户量已经在产生大量数据,而这对训练 神经网络 十分重要。“乔布斯说,一夜之间就会拥有数百万用户,还不用公测。突然之间就会有用户,他们会告诉你,人们如何与应用对话。这是第一次革命,那之后 神经网络 时代到来了。”
随着Siri转移到用 神经网络 处理 语音识别 而来的,还有几位AI专家,其中包括现在语音组的主管Alex Acero。Acero的 语音识别 经历始于90年代的 苹果 ,后来他在微软研究院工作了多年。“我喜欢这类工作,也发表了很多论文。当Siri出现时,我意识到这是让深度 神经网络 应用得以实现的机会,不是让几百人用,而是让数百万人用。”换句话说,他就是 苹果 想找的那类科学家优先考虑产品而非发表论文。
当Acero在三年前加入时,Siri用的语音技术仍基本来自第三方的授权,而这种情况必须改变。Federighi意识到,这是 苹果 不断在重复的一种模式。“随着一项技术对开发核心产品变得越来越重要,我们会让内部逐渐接手开发。要开发伟大的产品,我们希望内部拥有技术,并在内部创新, 语音识别 就是一个很好的例子。”
团队开始训练 神经网络 ,以替代Siri早前的技术。 苹果 的GPU集群不停运转,调用了大量数量。2014年7月的发布证明,所有努力都没有白费。
Acero表示,“当时在所有语言上,错误率降低了两倍,在很多场景下还不止如此。这都要归功于深度学习及对它的优化,不仅是 算法 方面,更是在产品开发的整个过程上。”
苹果 不是第一家在 语音识别 中使用DNN的公司,但它证明,控制整个运转系统会产生优势。Acero表示,正是因为 苹果 自己设计芯片,他能直接与编写固件的芯片设计组工程师合作,最大化提升 神经网络 的性能。Siri团队的需求甚至影响了iPhone设计的方方面面。













