为机器人寻找真实人脸
这家机器人公司已经要求Geomiq帮助他们完成一款最先进人形机器人的收尾工作,他们希望投入生产时,机器人能有一张“亲切而友好”的人脸。虽然没有太多有关该项目的细节透露,但该公司已经告知,如果你的脸被选中,你就可以看到自己的脸出现在全球数千个版本的机器人头上。
这家公司还透露,其机器人项目已经筹备了五年,这种产品将成为老年人的“虚拟朋友”,帮助他们排解孤独和寂寞。据估计,到2050年,85岁以上的成年人数量预计将增加两倍,设计用于陪伴老年人的机器人将变得越来越普遍。它们也有实际的用途,比如响应语音命令,提供主动的通知和建议,让人监控家里的情况等。
除此之外,设计师没有透露太多信息,只是说这种机器人将于明年开始制造,完成后将“随时向公众开售”。在应用程序页面上,Geomiq承认,将脸部永久授权给机器人公司“可能是个极其重大的决定”。Geomiq指出,他们不能披露太多信息,但透露这家机器人公司是由几家风投公司私人出资支持的,其中包括一家总部位于上海的顶级基金。
这家神秘机器人公司没有提出对申请者年龄或性别要求,只是要求那些想要将自己的脸授权出来的人通过电子邮件提交照片,以赢得获取13万美元(约合92万元人民币)授权合同的机会。进入“下一阶段”的候选人显然将获得有关该项目的全部细节。Geomiq说,保密是由于它与机器人的设计者和投资者签署了保密协议。
这种为机器人寻找合适人脸的做法在公众中获得的回应好坏参半。有些人表示,这就像一部糟糕的科幻电影情节。他们认为该公司应该使用数据集中的信息来创建假脸,这些数据集上有超过10万张逼真但不是真实的脸,就像著名的人形机器人索菲亚(Sophia)那样,索菲亚能够显示50多种面部表情。
有50多种表情的索菲亚
类人机器人索菲亚于2015年面世,2017年访问澳大利亚,甚至在此期间接受了电视采访。她也被授予沙特阿拉伯的正式公民身份,使她成为世界上第一个机器人公民。她的设计师、汉森机器人公司首席执行官大卫·汉森(David Hanson),曾是迪士尼的雕塑家和电影制作人。
汉森以英国电影明星奥黛丽·赫本(Audrey Hepburn)为原型开发的索菲亚,但看起来依然无法与真人相提并论。汉森希望索菲亚拥有“简单的优雅”,平易近人,帮助她被人类所接受。她被设计成有幽默感,并通过丰富的面部表情表达情感。
目前在世界各地使用的大多数机器人看起来都不像人类,他们的设计师甚至没有尝试让他们与人类相似。例如,非人形机器人越来越多地在工厂、仓库和矿山中执行重复性、危险性的任务,有时候甚至需要以比最熟练的人类更精确的方式进行。
机器人也可有人性化面孔
不过,德国机器人研究人员已经与日本科学家联手,开发出一种巧妙的技术解决方案,使机器人具有人性化的面孔。通过使用投影仪将人脸3D图像投射到塑料面具背面,并使用计算机控制语音和面部表情,研究人员成功地创造出了Mask-bot,即非常逼真的人形塑料头。
Mask-bot已经可以重现简单的对话。例如,当有人说“彩虹”时,机器人会摆动它的眼睑,并以令人惊讶的复杂句子作为回应:“当阳光照射到空气中的雨滴时,它们的行为就像棱镜一样,通过反射形成了彩虹”。当Mask-bot说话的时候,它也会轻微移动它的头,以扬起眉毛来创造知识渊博的印象。
乍一看,这个像真正会说话的人的东西实际上只是个新机器人脸的原型,这张脸是由德国TU München认知系统研究所(ICS)与日本团队合作开发的。ICS团队负责人Gordon Cheng教授预测:“Mask-bot将影响我们人类未来与机器人沟通的方式。”研究人员在创建Mask-bot的过程中开发了几项创新。
任意数量的真实3D面部投影就是其中之一。尽管其他团队也开发出了三维人脸,但它们看起来都有浓郁的卡通风格。然而,Mask-bot可以在透明的塑料面具上显示出逼真的三维面部,并且可以根据需要做出改变。位于面具后面的投影仪精确地将人脸投射到面具背面,创造出可以从各种角度(包括侧面)看起来都非常逼真的五官特征。
这意味着,在带有微距适配器的高压缩鱼眼镜头和面罩之间只有12厘米的间隙。因此,研究人员必须确保能够在这么短的距离内将完整的人脸投射到面具上。Mask-bot也足够明亮,可以在白天发挥作用,这要归功于特别坚固的小型投影仪和涂在塑料面罩内部的发光涂料。
新系统的这个创新部分将很快就可部署在视频会议中。研究人员解释道:“通常,与会者的面部都会显示在屏幕上。然而,使用Mask-bot,你可以创建真实的人脸复制品,这个人实际上就坐在会议桌上和你说话。你可以为男性和女性使用通用面具,也可以为每个人提供定制面具。”
为了用作机器人脸,Mask-bot必须能够在不需要发言者视频图像的情况下工作。因此,一种新的程序已经使系统能够将正常的二维照片转换为三维面具的正确比例投影,进一步改进算法就可提供面部表情和声音。
为了复制面部表情,研究人员开发了会说话的头部动画引擎。在这个系统中,当人们说话时,电脑会从动作捕捉系统收集到的大量面部动作数据中筛选出与特定声音(即音素)最匹配的面部表情。计算机从每个表情中提取面部坐标,然后可以将其分配给任何新的面部,从而使其变得栩栩如生。情感合成软件提供了可见的细微情感差别,可以让机器人脸展示出高兴、悲伤或生气情绪。
Mask-bot机器人可以真实地再现通过键盘输入的内容,包括英语、日语,很快还有德语。一个强大的文本到语音系统将文本转换成音频信号,生成女性或男性的声音,然后可以设置为安静或响亮,快乐或悲伤,所有这些只需按下按钮即可。但是Mask-bot还不能理解大部分口语,它目前只能监听并依据固定编程做出适当的响应。
本文素材来自互联网