终于开始“说人话”的智能助手
早在2007年,苹果率先推出了这款搭载于iPhone4S的智能语音控制功能,用户利用Siri可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。
从2017年开始,Siri逐渐迎来更丰富的更新,加入了实时翻译功能,支持英语、法语、德语等语言,与此同时,Siri的智能化还进一步得到提升,还支持上下文的预测功能。
但一直以来,由于苹果的封闭性,Siri的可用性还是饱受诟病,在AI技术方面更是被吐槽为“人工智障”,从今年的WWDC来看,苹果希望摆脱智障的帽子,起码让Siri交流起来更像真人了。
具体来讲,随着深度学习技术的不断成熟,基于深度神经网络的语音合成逐渐成为语音合成领域的主流方法,这次苹果采用的就是Neural TTS (神经网络语音合成)技术(如上图),这样的技术应用在国内已经很多,AI合成语音已经可以以假乱真。
别人吃剩下的声纹识别来了
HomePod是苹果在2017年WWDC推出的智能音箱产品,该音响7英寸高,拥有7个高频扬声器和一个很大的低频扬声器,配备精准的音效喇叭和风向控制。
这是苹果的第一款智能音箱硬件,一经推出便口碑两重天,很多人赞扬它的音质和曼妙的腰线,摆放在哪里都不违和的设计,但更多人的指责它封闭的应用生态和隐私性。
这里提到的隐私性就是指这款产品标榜的Siri唤醒和发布指令,在此之前,任何在它旁边的人都可以唤醒它,只要说出“朗读短信”,用户的秘密就大告天下了。
在今年的WWDC现场,苹果终于为HomePod加入了声纹识别功能,它可以智能区别与它对话的是哪位,声纹识别(Voiceprint Recognize)是一项提取说话人声音特征和说话内容信息,自动核验说话人身份的技术,目前已经广泛应用在了考勤系统、远程认证、门禁系统等场景之中。
在中国厂商发布的智能音箱产品中更是早有应用,这回苹果算是玩大家剩下的,就看它的实际体验能否逆袭领跑了,拭目以待。
保护隐私 用户的云端数据苹果也不看
美国消费者保护组织Consumer Watchdog曾出具过一份报告,指责来自亚马逊和谷歌的专利申请曝光了其智能音箱是如何“偷听”用户的。该组织的研究称,这些设备可能被用作收集大量信息和广告推广的监听设备。
事实上,这样的用户反馈确实不绝于耳,Alexa曾将夫妻之间私人谈话的内容偷偷记录下来,并发给了其中一名家庭成员的同事,他当即打电话说这对夫妇:“赶紧拔掉你的Alexa设备!”
针对种种担忧,欧盟更是推出了史上最严的隐私保护条例GDPR(General Data Protection Regulation),目的就在于遏制个人信息被滥用,保护个人隐私。
虽然没有证据表明苹果设备存在这样的隐患,但也足够引起大家的担忧。
而苹果的隐私保护做法在2019 WWDC有了进一步的补充和升级,在Watch OS 方面,苹果推出了运动推荐和数据分析的功能,在智能家居应用中,苹果更新了视频分析和数据存储功能。
以上二者的共同点是,苹果将处置数据的权利交给用户,用户可以选择不上传(保存在本地的加密芯片),也可以选择上传到云端,但苹果称用户的数据他们也无能查看。
值得一提都是,苹果还在智能家居的数据保护中加入了路由器的防护,以此来保障用户不在任何的环节遭遇攻击。
在增强现实里畅游“我的世界”
ARKit是苹果在2017年WWDC推出的AR开发平台,开发人员可以使用这套工具iPhone和iPad创建增强现实应用程序。
在WWDC 2019苹果带来了AR应用的更新和全新的RealityKit 平台,如上图,苹果在现场展示了《我的世界》游戏的AR版本,这是一款堆方块、不断冒险的游戏,融入增强现实之后趣味性十足,还可以多人互动游戏。
此外,苹果还带来了RealityKit开发工具,新增了AR模型还可以融合人物,支持动作捕捉,并且可以实现照片级渲染,环境和相机效果。
美国专利局曾批准了苹果的一项申请:头盔将配置摄像头,用于辨认和注释兴趣点和其他对象。大家一度认为苹果会在WWDC推出AR硬件。
库克有言,苹果认为AR增强现实会是未来10年非常重要的技术,我们会在这个领域投入更多。有分析认为,随着5G技术的应用,AR将迎来成熟期,目前AR相关专利申请正在持续攀升。
总结
依然是一场很苹果的开发者大会,在人工智能技术方面不冒进,坚持用产品和体验说话,他们强调自己是一家软件公司,在细枝末节上的打磨确实值得称赞。
但不可否认,苹果的封闭性依然制约着其AI功能大放异彩的机会,Siri本可以做得更多,话不多说,期待开放内测。
本文素材来自互联网