Fdferighi表示,“不仅仅是芯片,还涉及设备上的麦克风,以及麦克风安装的位置,还有如何调整硬件,以及处理音频的软件栈。这需要所有组件的协调,比起只是开发软件的公司,有着惊人的优势。”
另一个优势是,当 苹果 的 神经网络 在一个产品上成功时,还能成为其它产品的核心技术。 机器学习 让Siri理解了用户,也让输入方式由手动变成了听写。也正是因为Siri的技术,用户语音输入的信息也变得更流畅和完整。
Cue提到的Siri第二个部分是 自然语言 理解。Siri在2014年11月开始用 机器学习 理解用户的意图,并在一年后推出了深度学习版。如在 语音识别 上一样, 机器学习 提升了体验,特别是在理解指令上。
苹果 认为,没有Siri上的技术,它不太可能开发出最新版的Apple TV,因为后者也有语音控制功能。尽管早期的Siri版本要求你用清晰的方式说话,但深度学习加强版不仅能从大量电影和音乐中找到特定的选择,更能处理“播放一部汤姆汉克斯主演的优秀惊悚片”这样的概念。这在以前是完全不可能的。
在即将正式发布的iOS 10中,Siri的声音是最后一个被 机器学习 改造的部分。同样,深度 神经网络 替代了原先授权的技术。Siri的声音来自一家语音中心收集的录音 数据库 ,每句话都是语音段拼贴的结果。 机器学习 让语音变得平滑,听起来更像一个真人。
这看起来只是很小的细节,但更自然的声音能为Siri带来很大的改变。Gruber认为,“如果声音质量更高,人们会感到更加可信。更好的语音能吸引用户,让他们更常使用。”
使用Siri的意愿,以及 机器学习 在技术上的提升,都在 苹果 向开发者开放Siri的过程中十分重要。许多人注意到, 苹果 在Siri上的合伙量只有两位数,远远落后于亚马逊的Alexa,后者称外部开发者帮助开发了1000多项技能。 苹果 认为这种比较没有意义,因为亚马逊用户要使用特定的指令方式,才可用到那些技能。 苹果 表示,Siri在与Uber和SquareCash等服务的整合上会更自然。
与此同时, 苹果 对Siri的改善也得到了回报,用户发现了一些新功能,也感到常用的查询变得更准确,而相应的,查询数量也不断增长。
五
或许, 苹果 使用 机器学习 技术中遇到的最大问题,是如何坚持保护用户隐私的原则。 苹果 会加密用户信息,包括公司律师在内的任何人都无法读龋FBI也不能,即便获得了批准(按:关于 苹果 与FBI的对战,可阅读雷锋网(搜索“雷锋网”公众号关注)的解读)。它还表示,不会收集用户信息用于广告目的。














