技术研究者的严肃提醒
那是去年 6 月一个温暖的夜晚,时钟指向了大约凌晨 1 点,夜已深。此刻的李飞飞却并没有休息,她正穿着睡衣,坐在华盛顿一家酒店的房间里,练习她几小时后要发表的演讲。在睡觉前,李飞飞还是觉得有些不妥,从她的演讲笔记中删除了一整段,以确保她能在规定的短时间内通过演讲传达最重要的观点。醒来后,这位身高 1 米 60 的人工智能专家没有套上经常穿的 T 恤和牛仔裤,而是「精心」地穿上了一双靴子和一件黑色和海军蓝针织连衣裙。然后她用 Uber 叫了一辆车,起身前往美国国会大厦南部的 Rayburn House 办公楼。
在进入美国众议院科学、空间和技术委员会的会议室之前,她举起了自己的手机,拍下了这扇超大木门的照片。(她说:「作为一名科学家,我觉得这个委员会对我来说意义很特殊」。)接着,她郑重地走进了这个宽敞的房间,前往听证席就坐。
这天早上的听证题为「人工智能——能力越大,责任越大」(https://youtu.be/_ObbBp5Vo9U)。到场的嘉宾包括政府问责局的首席科学家 Timothy Persons,非营利组织 OpenAI 的联合创始人兼首席技术官 Greg Brockman。但听证席上只有李飞飞这位杰出的女科学家才有资格宣称自己在人工智能领域取得了突破性的成就。作为创建了 ImageNet(最著名的计算机图像识别的数据库)的研究者,她毫无疑问属于科研最尖端的科学家之一。取得了如此之大成就的科学家的人数也许少到用一个餐桌就能装下,他们为人工智能技术近些年取得的重大进步立下了汗马功劳。
也就是在那个 6 月,李飞飞暂时离开了她担任主任的斯坦福大学人工智能实验室,转而出任谷歌云首席人工智能科学家。但她之所以会出现在该委员会,是因为她也是一家非营利组织 AI4All 的联合创始人,该组织致力于让女性和有色人种也加入人工智能技术的建造中。
不出意料,当天议员们向她寻求了一些专业意见。但她谈话的内容却令人惊讶:这个她深爱的领域(人工智能)给人们带来的重大危险。
一项发明从出现到产生影响的时间可能很短。在像 ImageNet 等人工智能工具的帮助下,计算机可以学习一项特定的任务,然后以秒杀人类的速度行动。随着这项技术变得越来越精细,人们开始使用它来过滤、分类和分析数据,并做出具有全球和社会影响的决策。虽然这些工具已经在某种程度上被使用了超过60 年,但在过去的十年中,我们开始使用他们来完成能够改变人类生活轨迹的高级任务:今天,人工智能可以帮助确定患者的疾病治疗方案、谁有资格享受人寿保险、一个人需要服刑多长时间、哪些求职者可以接受面试。
当然,这些力量也可能招致一些危险的结果。例如,亚马逊不得不放弃一款人工智能招聘软件,该软件学会了给包含「女性」一词的简历打低分。相信大家都不会忘记谷歌在 2015 年闹出的大乌龙,当时,它的照片识别软件把黑人误认为大猩猩;或者微软的人工智能社交聊天机器人在 twitter 上被网友们教会了发布种族歧视言论。但这些问题都是可以解释的,因此可以通过改进技术来逆转这种局面。李飞飞相信,在不久的将来,我们会遇到一个不可能纠正错误的时刻。这是因为我们对人工智能技术的利用过于迅速和广泛。
那天早上,李飞飞之所以会在 Rayburn 大楼出席听证会,是因为她坚信自己的领域需要重新调整。那些杰出的、强大的、大多数为男性的科技领袖们一直在警告,未来人工智能驱动的技术将对人类构成生存的威胁。但是李飞飞认为,人们可能过于关注并夸大这种威胁。她关注的是一个不那么夸张但更重要的问题:「人工智能将如何影响人们的工作和生活方式」。它必然会改变人类的体验,不一定会变得更好。「我们还有时间」李飞飞说,「但我们现在必须行动」。李飞飞认为,如果我们对人工智能的设计方式进行根本性的变革,并改变完成这项工程的人,这项技术将成为一股有益的变革力量。如果不能做出这样的变革,我们就没有考虑到一些人性的因素(李飞飞李开复同台出席WIRED 25 周年纪念,继续呼吁 AI 中的人性)。
在听证会上,李飞飞是最后一个发言的。听众们肯定无法想到她在深夜训练时是多么紧张,她说道:「人工智能技术中没有任何虚假!」她提高了语调。「它受到人们的启发,由人们创造,最重要的是,它影响着人们。这是一个我们刚刚开始了解的强大工具,伴随它而来的也有深远的责任」。在她周围,人们目光如炬。有一位一直在场的女士很赞同李飞飞的观点,甚至忍不住发出了声音。
从中国小孩到改变 AI 发展进程的美国教授
李飞飞在中国南方的工业城市——成都长大。曾经的她,是一个孤独而聪明的孩子,也是一个铁杆书迷。她的家庭总是有点不寻常:在一种不喜欢宠物的文化中,她的父亲给她带了一只小狗。她的母亲来自一个知识分子家庭,她鼓励她读《简爱》。(李飞飞说:「在勃朗特家族中,我最喜欢艾米丽(呼啸山庄的作者)」)在李飞飞 12 岁时,她的父亲移民到了新泽西州的帕西帕尼,那时,她和母亲有好几年没见到他了。在李飞飞 16 岁时,他和母亲与父亲搬到了一起。在美国的第二天,李的父亲带她去了一个加油站,让她告诉技工去帮忙修车。当时的李飞飞几乎不会说英语,但通过手势,李飞飞成功地解释了这个问题。在不到两年的时间里,李飞飞熟练掌握了英语,其英语水平可以作为一名翻译、口译人员甚至是她的父母的辩护律师,因为她的父母只会使用最基本的英语。她说:「我不得不成为父母的嘴巴和耳朵」。
她在学校的表现也十分出色。飞飞的父亲喜欢在清仓大甩卖中淘东西,一次,他给李飞飞买了一个科学计算器。之后,李飞飞就一直在数学课上用这个计算器,直到一位老师指出她有个计算结果出了错,才发现这个计算器有一个功能键坏掉了。李飞飞十分感谢另一位高中数学老师 Bob Sabella 为她指引了学术生涯的方向,并帮助她获得了新的美国身份。帕西帕尼高中没有微积分高级课程,所以他自己编写了一个临时使用的版本,在午休时间教李飞飞微积分。Sabella 和他的妻子也把李飞飞作为了自己家庭的一份子,带她去迪斯尼度假,并借给她 2 万美元,让她的父母开了一家干洗店。1995年,她获得了普林斯顿大学的奖学金,成为了普林斯顿大学的学生。在那里,她几乎每个周末都要回家帮助打理家里的生意。
在大学里,李飞飞的兴趣十分广泛。她主修物理,同时也学习计算机科学和工程学。2000 年,她在帕萨迪纳的加州理工学院攻读博士学位,同时研究神经科学和计算机科学。
李飞飞具有很强的发现并培养看似不同领域之间的联系的能力,这使李飞飞产生了 ImageNet 的想法。那时,她的计算机视觉同行正在研究帮助计算机感图像和对图像进行解码的模型,但这些模型的适用范围很有限:研究人员可能要编写一种算法来识别狗,再用另一种算法来识别猫。这让李飞飞不仅怀疑道:问题不在于模型而在于数据。在她看来,如果一个孩子在是通过体验视觉世界(即在儿时通过观察无数的物体和场景)来学会「看」的技能,或许计算机也可以通过类似的方式分析各种各样的图像以及它们之间的关系来学会「看」。对李飞飞来说,这个领悟是意义深远的。李飞飞说:「这是一种组织整个世界的视觉概念的方法」 。
但是她很难说服同事相信:在一个巨大的数据库中为每个物体的每个可能的图片加上标签是合理的。此外,李飞飞决定,如果要让这个想法奏效,那么标签的范围需要囊括从通用类(如 「哺乳动物」)高度细化的类(如「星鼻鼹」)。2007 年,李飞飞回到了普林斯顿做助理教授,当她谈到 ImageNet 的想法时,几乎无人问津。最后,一位专攻计算机体系结构的教授(李凯,普林斯顿大学教授)同意作为合作者加入她的课题。
接下来,李飞飞就面临着构建 ImageNet 这个庞然大物的艰难挑战。这意味着很多人将不得不花费大量时间来做繁琐的标记照片的工作。李飞飞试着给参与这项工作的普林斯顿学生每小时支付 10 美元,但工作仍然进展缓慢。一天,一个学生问她是否听说过 Amazon Mechanical Turk 这个众包平台将图片标记的工作众包出去。刹那之间她就可以聚集许多工人,而成本缺相对来说十分低廉。但从少数普林斯顿学生到数万名隐形探索者的劳动力扩张,自身也存在挑战。李飞飞不得不考虑工人间可能的偏见。「在线工人,他们的目标是用最简单的方法赚钱,对吧?」她说。如果你让他们从 100 张图片中选择熊猫,怎样才能阻止他们乱点一气呢?因此,她嵌入并跟踪了一些图像,例如已经正确识别为狗的金毛猎犬的照片,作为对照组。如果众包的工人可以正确标记这些图像,那就可以认为他们在诚实地工作。
2009 年,李飞飞团队认为 320 万张的(后来增加到 1500 万张)大型图片集已足够满足使用需要了,他们在发布数据库的同时发表了一篇关于该数据库的论文。起初这个项目并没有受到太大的关注,但后来李飞飞的团队有了一个主意:他们联系了次年在欧洲举行的计算机视觉比赛的组织者,请求他们允许参赛者使用 ImageNet 数据库来训练他们的算法。这就是 ImageNet大规模视觉识别挑战,ILSVRC。
几乎在同一时间,李飞飞加入了斯坦福大学任助理教授。之后,她嫁给了机器人学家Silvio Savarese。但是他在密歇根大学有一份工作,两人的距离很远。「 我们知道,对我们来说,到硅谷工作更容易解决我们分居两地的问题」李飞飞说。(Savarese于 2013 年加入斯坦福大学。)「同时,斯坦福大学是如此特别,因为它是人工智能的摇篮之一」。
2012 年,多伦多大学的研究员 Geoffrey Hinton 带队参加了 ImageNet 竞赛,利用该数据库来训练一种被称为深度神经网络的人工智能模型。最终结果比之前的任何模型都要精确得多,Hinton 的团队在比赛中因此得到了冠军。李飞飞本来没打算去看 Hinton 领奖,她在休产假,而颁奖典礼远在意大利佛罗伦萨举行。但她认识到历史性的时刻正在到来。于是她在最后关头购买了一张机票,搭乘午夜航班前往佛罗伦萨。事实证明,Hinton 的 ImageNet 赋能的神经网络对计算机视觉技术产生了翻天覆地的改变。截止到 2017 年,也就是ImageNet比赛的最后一年,计算机识别图像中的物体的错误率从 2012 年的 15% 降到了不到 3%。这让人们认识到,至少通过这种方法可以让计算机比人类更善于「看」。
ImageNet 使深度学习的发展成为了可能,在它的帮助下,近期人类才能在自动驾驶汽车车、面部识别、可以识别出物体(并且告诉你它们是否正在打折)的手机摄像头方面取得进展。
技术不能解决一切,比如人类文化和偏见
Hinton 领奖后不久,李飞飞产假还没休完时,便开始思考:「为什么在她的同行中女性如此之少?」那时,她敏锐地感受到了这个现象,她看到了在人工智能领域这样性别不对等的现象正在逐渐成为一个大的问题。大多数构建人工智能算法的科学家通常都是具有相同背景的男性。他们有自己特有的世界观,这样的世界观会渗透到他们正从事的项目、甚至是他们预想到的危险情况中。许多人工智能的缔造者都是拥有科幻梦想的男孩,他们可能会想到《终结者》和《刀锋战士》中(人工智能会对人类产生的威胁)的场景。李飞飞认为,担心这种事情没什么不对的,但这些想法偏离了人工智能可能存在风险的狭义的观点。
正如李飞飞所说,深度学习系统的「输入有偏差,那么输出就有偏差」。李飞飞认识到,虽然驱动人工智能的算法可能貌似是中性的,但最终塑造这些算法结果的数据和应用程序却不是这样。重要的是创建它的人是谁,以及他们为什么要创建它。那天,李飞飞在国会山指出,如果没有一群背景多样的工程师,我们可能会创建出一套有偏差的算法,做出不公平的贷款申请决策,或者只以白人的面部图像为训练数据训练神经网络,从而创建出一种在黑人的脸上表现不佳的模型。李飞飞说:「我认为,如果我们 20 年后才醒悟,发现我们的技术、领导者和从业者缺乏多样性,那对我来说就是一种灾难」。
李飞飞逐渐开始相信,我们关键应该把人工智能的发展重点放在帮助提升人类的体验上。她在斯坦福大学参与的一个项目是与医学院合作,将人工智能技术带到重症监护室中,努力减少诸如医院获得性感染之类的问题。该项目涉及到开发一个摄像头系统,这个系统可以监控洗手站,并在医院工作人员应该如何正确擦洗时给出警示。这种类型的跨学科合作是不同寻常的。领导斯坦福大学临床卓越研究中心的 Arnold Milstein教授说:「没有其他来自计算机科学领域的人向我伸出援手」。
这项工作让李飞飞看到了人工智能技术未来进化的希望。人工智能技术可以被用来对人们不够完善的技能技能作为补充,而不是简单地将人类的技能替换掉。如果其他学科的人(甚至是现实世界中的人)加入这一工程,他们就可以制造出一些工具来扩展人类能力,比如实现耗时工作自动化,让重症监护室的护士有更多时间陪伴病人,而不是建立人工智能使某人的购物体验自动化,并让出纳员下岗。
考虑到人工智能技术正在飞速发展,李飞飞认为她的团队需要极可能快地进行人员调整。
李飞飞一直对数学相当很痴迷,她也认识到要让女性或者其它有色人种进入计算机科学领域,需要付出巨大的努力。根据国家科学基金委员会的统计,2000 年,女性拿到的计算机学士学位只占全年总量的 28%,在2015 年更是降到只有 18%。即使是在李飞飞自己的实验室内,也很难聘请到足够多的有色人种和女性研究员。李飞飞说,虽然她的实验室比典型 人工智能实验室更加多元化,但是男性仍然占主导。她说:「我们也没有足够多的女研究者,少数族裔的研究人员更是稀缺,甚至在进入实验室的渠道中也是这样的情况。学生参加人工智能会议的时候,会看到 90% 的与会者都是男性,非裔美国人的数量也远没有白人男性多」。
当李飞飞成为 Olga Russakovsky 这位女性研究员的导师时,Russakovsky 几乎要放弃自己的职业生涯了。Russakovsky当时已经是一名熟练的计算机科研工作者,她拥有数学学士学位和计算机硕士学位,都是在斯坦福拿到的,但是她并不善于写学术论文。作为实验室中唯一的女性,她觉得自己与同行脱节了。后来李飞飞来到斯坦福,Russakovsky 的学术生涯出现了转机。李飞飞帮助 Russakovsky 学会了一些做好科研所需的技能,Russakovsky说:「李飞飞还让我重拾自信」。现在 Russakovsky 成为了普林斯顿大学计算机系的助理教授。
4 年前,Russakovsky 拿到了自己的博士学位,她请求李飞飞帮助自己建一个夏令营,让那些对人工智能有兴趣的女生加入她们。李飞飞立刻就同意了她的请求,她们召集了一群志愿者,给高中二年级学生打电话。虽然她们只提供了 24 个名额,但是在一个月之内却收到 200 份申请。2 年后,他们扩大了这个项目,设立了非盈利组织 AI4All,只在将那些缺乏机会的年轻人带到斯坦福、加州大学伯克利分校学习人工智能技术,包括女孩、有色人种、经济状况不佳的人。
在加州奥克兰市区的 Kapor 中心,AI4All 有一个狭小的共享办公室,现在由于组织的成长,他们即将搬到新的办公室去。现在 AI4All 在 6 所大学的校园中设有夏令营。去年她们在CMU举办了夏令营,提供了 20 个名额,却收到了 900 份申请。有一名 AI4All 学生想用计算机视觉技术侦测眼病,还有一人用人工智能编写程序,给 911 呼叫按紧急程度排序;由于救护车未能及时抵达,这名学员的祖母不幸离开人世。很明显,从业人员的观点会给未来的人工智能工具带来巨大影响。
我们对人工智能负有责任,不管是在谷歌还是在斯坦福
在斯坦福掌管实验室近 3 年后,李飞飞于 2016 年休假,作为谷歌云首席科学家加盟谷歌。谷歌云是该公司的企业级计算业务部门。李飞飞想知道工业界是如何运作的,如果能够直击用户的痛点来部署新的人工智能工具,就可以扩大其在交叉学科研究的范围。Facebook、谷歌、微软等企业也投入了巨资,研究人工智能技术,希望人工智能能够帮助他们的业务快速发展。与高校相比,企业拥有更多且更优质的数据。而对于人工智能研究人员来说,数据就如同燃料。
最开始时,李飞飞满怀激情。她与那些可以将她的科学研究应用于现实场景的公司进行会谈。在她的领导下,谷歌推出了面向公众的人工智能工具,有了这套工具,任何人不需要写一行代码就能开发机器学习算法。她在中国设立了新的实验室,致力于将人工智能工具用于医疗健康领域。她在达沃斯世界经济论坛发表演讲,与国家元首、流行艺人交流。
然而,在私营企业工作给李飞飞带来了令她感到不适的新压力。去年春天,由于谷歌与美国国防部签署 Maven 计划的合同,李飞飞招来了公众的非议。该项目就是要用人工智能工具分析视频图像,而分析的结果可能会被用来控制无人机袭击目标,按照谷歌的说法,它们可以用人工智能技术识别低分辨率目标,拯救生命是他们的首要目标。然而,许多谷歌的员工反对公司将自己开发的技术应用于军用无人机。大约有 4000 名员工签署了请愿书,要求公司发表声明,承诺谷歌与合同承包商永远不会开发战争技术。还有一些员工愤然辞职抗议。
虽然李飞飞没有直接参与这项交易,不过负责 Maven 项目的正是她所工作的部门。李飞飞写过一封邮件参与这项讨论,希望公司不要陷入尴尬境地。然而这封邮件被泄露给了「纽约时报」,一夜之间,媒体报道将李飞飞推向风口浪尖。这样的舆论似乎让人十分困惑,因为李飞飞在计算机行业中往往给人一种道德高尚的形象。事实上,在公众发出抗议之前,李飞飞认为这门技术是无害的,她从未想过员工会反对。
但李飞飞确实意识到了这个事件为何会爆发,她说:「问题的关键不在于事件本身,而在于这件事发生的时间,目前我们的企业需要有紧迫的责任感。面对人工智能的崛起,硅谷应该积极参与到这种对话中…Maven 项目只是一个导火索,」李飞飞说。「不做恶(谷歌的声明)」的立场还不够鲜明。
直到谷歌宣布它不会再与 Maven 计划签署新的合同,事件才平复下来。包括李飞飞在内的一些谷歌科学家和高管,也编写了一份公开的指南,承诺谷歌会重点研究造福于人类社会的人工智能技术,避免工具的实现出现偏差,会避免这些工具最终对人类造成伤害。一直以来,李飞飞都在为重返斯坦福做准备,不过她觉得自己有必要亲眼看到指南通过。李飞飞说:「我觉得每个机构都必须设立一套行事原则和问责机制。Benjamin Franklin 曾经说过,当宪法出台时,它可能并不完美,但它在当下的确是最好的。大家可能仍然会各持己见,但不同的派别可以通过对话解决问题」。 李飞飞说,指南发表时,她感到那时这一年年最快乐的时刻。李飞飞还说:「对我个人而言,能够有幸参与到这项工作中,做出一点贡献,是很重要的」。
6 月份,我在李飞飞的家中对她进行访问,李飞飞的家在斯坦福校园一条静谧的街道的尽头。那时刚好晚上 8 点多一些,当我们交流时,她的丈夫将小儿子和女儿安排到楼上睡觉,飞飞的父母在亲家的单元楼过夜。餐厅已经变成了小朋友的游戏室,所以我们坐在客厅聊天。在她家里,家庭照片随处可见,书架上放着一台 1930 年代的老电话。当我问她时为什么会有这样的老电话时,她说因为父母是移民过来的,所以父亲仍旧喜欢去逛旧货市场。
在我们聊天时,李飞飞的手机上跳出来了一条信息。医生给李飞飞的母亲开了药,父母让她将说明翻译给自己听。对李飞飞来说,有时她可能正在 Googleplex 开会,或者在世界经济论坛演讲,又或者正在参加国会听证会,但只要父母需要帮助,都会发短信给她。她往往会马上会,并且不会打断自己的思路。
在生活的大部分时间里,李飞飞往往需要同时关注两件似乎截然不同的事。她是一名科学家,但同时对艺术也有着深刻的见解。她既是美国人,又是中国人。她对人很感兴趣,也对机器人感兴趣。
7 月末,李飞飞打电话给我,当时她们家正在为旅行做准备,她在给女儿洗手。李飞飞问我:「你看到 Shannon Vallor 发表的声明了吗?」Vallor是 Santa Clara大学的哲学家,专门研究新兴科学技术存在的哲学与伦理问题,她说自己要到谷歌云工作,担任伦理顾问。李飞飞为此做了巨大努力,她甚至在华盛顿发表的证词中,曾引用 Vallor 的话说:「没有真正独立的机器价值,机器价值就是人类价值」。谷歌任命史无前例。其它企业也纷纷开始为「它们的人工智能软件会被如何使用,谁可以使用它们的人工智能软件」建立保护机制。微软在2016年设立了一个内部伦理委员会,该公司声称:由于伦理委员会存在伦理担忧,它已经拒绝与某些潜在客户合作。微软还开始限制其人工智能技术被使用的方式,比如禁止面部世界方面的一些应用程序。
然而,从某种程度上来说,公司内部的道德伦理监察机制的存在,也只是为了保障公司本身的利益。当我 7 月和李飞飞谈话时,她意识到自己即将离开谷歌,她 2 年的假期就快要结束了。当时有许多人猜测说,李飞飞会因为 Maven 的失败而离职。不过李飞飞却说,她之所以回到斯坦福,主要是因为不想放弃学术职位,而且从和她的对话中也可以听出来她有些累了。李飞飞还说,在谷歌度过动荡的夏天之后,她帮助撰写的伦理指南就像是隧道尽头的光明。
李飞飞渴望能在斯坦福开展新的项目。秋天,李飞飞与斯坦福大学前教务长 John Etchemendy 宣布将设立一个把人工智能与人类学研究融合在一起的学术中心,将吸收自然科学和技术科学的交叉研究、设计研究、多学科研究。李飞飞认为:「作为一门新兴科学,人工智能从没有大力吸引人类学家和社会学家参与到研究中」。 许久以来,大家都认为这些领域对人工智能来说无关紧要,但李飞飞却认为它相当关键。
李飞飞是一名彻底的乐观主义者。在 6 月的听证会上,她曾告诉立法委员:「我深入思考了那些对人类来说既危险又有危害的工作,比如救火、自然灾害搜救」。她相信我们不仅应该尽可能避免让让人类身处险境,也坚信人工智能技术在这些工作中会起到很大的帮助。
当然,某个机构的某个项目对整个行业的改变成都是有限的。但是李飞飞还是认为要竭尽所能训练研究人员,让他们像伦理学家一样思考,背景各异的研究人员应该以原则而非利润为指导行事。
在电话中,我问李飞飞,她有没有想过也许可以用一种完全不同的方式来开发人工智能,避免出现我们现在所看到的问题。她回答说:「我觉得这很难想象!科学的进步和创新来自于几代人的乏味工作,反复试错。我们花了一段时间才认清这种偏见。我工作了 6 年,然后才意识到:『天啊,我们正在陷入危机』」。
在国会山,李飞飞曾说:「作为一名科学家,我很惭愧,人工智能这门学科目前还处于发展初期。这是一门只有 60 年历史的科学。与一些已经让人类的生活每一天都变得更好的科学相比(比如物理、化学、生物学),人工智能想要实现其帮助人类的潜力还有很长的路要走。在正确的引导下,人工智能会让生活变得更好。但是如果没有这种正确的引导,这种技术将会进一步扩大贫富差距,让这种技术变得更加排外,会强化我们这几代人努力克服的偏见」。李飞飞让我们相信,我们所处的时代正是人工智能这项技术被发明到其产生重大影响的转折点!
via wired.com
本文素材来自互联网