华裔科学家李飞飞 (Fei-Fei Li)- 将人类带入人工智能

人工智能专家李飞飞以建立ImageNet而闻名,该数据集使计算机视觉在2010年代取得了快速发展。她是斯坦福大学红杉资本计算机科学教授,也是Twitter的前董事。由于在构建机器学习和视觉理解的大型知识库方面的贡献,李飞飞于2020年当选为美国国家工程院院士。

李飞飞于1976年出生于中国北京,在成都长大。15岁时,她和母亲移居新泽西州,和父亲团聚。在她到美国的第二天,父亲带她去了一个加油站,让她告诉机械师把他的车修好。她几乎不会说英语,但通过手势,李飞飞达到了目的。在两年的时间里,李飞飞已经学会了足够的语言来担任翻译,口译,并成为她只学过最基本英语的父母的嘴巴和耳朵。

在《The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI》这本书里,她讲述了自己的经历,和心路历程。(这本书给孩子的最好礼物!)

李飞飞在学校的表现也很好。父亲喜欢在车库旧货市场淘东西,给她找了一个科学计算器,她在数学课上用这个计算器,直到一位老师查看了她错误的计算,发现它的功能键坏了。另一位高中数学老师鲍勃·萨贝拉(Bob Sabella)对她的学业有很大的帮助,帕西帕尼高中没有高级微积分课,所以他临时编了一个版本,在午休时间教李飞飞。萨贝拉和他的妻子也把她纳入了他们的家庭,带她去迪斯尼度假,并借给她2万美元开了一家干洗店,让她的父母经营。1995年,她获得了普林斯顿大学的奖学金,而她几乎每个周末都要回家帮忙经营父母的干洗店。

李飞飞的学术生涯开始于伊利诺伊大学香槟分校和普林斯顿大学担任助理教授。她于2009年加入斯坦福大学,后来成为斯坦福大学人工智能实验室(SAIL)的副教授和主任。

李飞飞斯坦福档案照

李飞飞的研究涵盖人工智能、机器学习、深度学习、计算机视觉和认知神经科学,发表在300多篇同行评审的研究论文中。她决心扩大和改进可用于训练人工智能算法的数据,于是推出了ImageNet——一个专门用于视觉对象识别软件研究的大型视觉数据库。

李飞飞能够发现并培养看似不同的领域之间的联系,正是这种能力让她想到了ImageNet。她的计算机视觉同行正在研究帮助计算机感知和解码图像的模型,但这些模型的范围有限:研究人员可能会编写一种算法来识别狗,另一种算法来识别猫。李开始怀疑问题是否不在于模型,而在于数据。她认为,如果一个孩子通过体验视觉世界来学习视觉——通过在幼年观察无数的物体和场景——也许计算机也可以以类似的方式学习,通过分析各种各样的图像以及它们之间的关系。意识到这一点对李飞飞来说意义重大。“这是一种组织整个世界视觉概念的方式,”她说。

但她很难说服她的同事们相信,在一个庞大的数据库中为每个物体的每一张可能的图片做标记是合理的。更重要的是,李飞飞已经决定,为了让这个想法奏效,标签需要从一般的(“哺乳动物”)到高度特殊的(“星鼻鼹鼠”)。2007年,李飞飞搬回普林斯顿大学担任助理教授,当她谈到ImageNet的想法时,她很难得到教职员工的帮助。最后,一位专攻计算机体系结构的教授同意与她合作。

她的下一个挑战是把这个庞然大物造出来。这意味着很多人将不得不花费大量时间来做标记照片的繁琐工作。李飞飞试着给普林斯顿的学生每小时10美元,但进展缓慢。然后一个学生问她是否听说过亚马逊土耳其机器人。突然间,她可以以很小的成本召集许多工人。但将员工队伍从少数普林斯顿学生扩大到数万名隐形的土耳其人,也面临着挑战。她必须考虑到工人可能存在的偏见。“网络工作者的目标是用最简单的方式赚钱,对吧?如果你让他们从100张图片中选择熊猫,是什么阻止他们点击所有图片?”因此,她嵌入并跟踪了某些图像——比如已经被正确识别为狗的金毛猎犬的照片——作为对照组。如果土耳其人给这些图像贴上了正确的标签,他们是在诚实地工作。

2009年,李飞飞的团队认为这个庞大的数据集——320万张图像——已经足够全面,可以使用了,他们发表了一篇论文,并发表了数据库。(后来增长到1500万。)起初,这个项目没有得到多少关注。但后来这个团队有了一个主意:他们联系了第二年在欧洲举行的计算机视觉比赛的组织者,请求他们允许参赛者使用Image-Net数据库来训练他们的算法。这就是ImageNet大规模视觉识别挑战赛。

大约在同一时间,李飞飞加入斯坦福大学担任助理教授。那时,她已经嫁给了机器人专家西尔维奥·萨瓦雷斯(Silvio Savarese)。但他在密歇根大学(University of Michigan)有一份工作,距离很遥远。“我们知道硅谷对我们来说更容易解决我们的两体问题,”李飞飞说。萨瓦雷斯于2013年加入斯坦福大学。“此外,斯坦福大学很特别,因为它是人工智能的发源地之一。”

2012年,多伦多大学的研究人员Geoffrey Hinton参加了ImageNet竞赛,使用该数据库训练一种被称为深度神经网络的人工智能。结果证明,它比以前的任何方法都要准确得多——他赢了。李飞飞并没有打算去看辛顿领奖 – 她当时正在休产假,颁奖典礼在意大利的佛罗伦萨举行。但她意识到,历史正在被创造。于是,她在最后一刻买了一张机票,坐夜间航班的中间座位赶到了意大利。Hinton的ImageNet神经网络改变了一切。到2017年,也就是比赛的最后一年,计算机识别图像中物体的错误率已从2012年的15%降至3%以下。至少在某种程度上,计算机的视觉能力已经超过了人类。

ImageNet使深度学习得以发展壮大——它是自动驾驶汽车、面部识别、可以识别物体(并告诉你它们是否待售)的手机摄像头最近取得进展的基础。

2017年1月至2018年秋季,她从斯坦福大学休假,加入谷歌云,担任人工智能/机器学习首席科学家和副总裁。在谷歌,她的团队专注于人工智能技术的民主化,降低企业和开发者的准入门槛,包括开发AutoML等产品。

2017年9月,谷歌从美国国防部获得了一份名为Maven项目的合同,该合同旨在利用人工智能技术解读无人机摄像头拍摄的图像。谷歌告诉那些抗议该公司在Maven项目上工作的员工,他们的角色“被明确限定为非冒犯性目的”。2018年6月,谷歌告诉员工,它不会寻求续约。

在后来泄露给记者的内部邮件中,李飞飞表达了对谷歌云在Maven项目中的作用的热情,但警告不要提及其人工智能组件,称军事人工智能在公众心中与自主武器的危险联系在一起。当被问及这些泄露的电子邮件时,李飞飞告诉《纽约时报》,“我相信以人为本的人工智能会以积极和仁慈的方式造福人类。从事任何我认为是将人工智能武器化的项目都与我的原则背道而驰。”

由于她在公司的军事合同中所扮演的角色而受到抨击,2018年秋天,李飞飞离开谷歌,回到斯坦福大学继续担任教授。

李飞飞还以非营利组织AI4ALL的联合创始人兼主席的身份而闻名,该组织的使命是通过以人为本的人工智能原则促进多样性和包容性,培养下一代人工智能技术人员、思想家和领导者。该项目是与梅琳达·盖茨和黄延森合作创建的。

对科技的贡献,有时并不需要复杂的技术,一个心念转弯,就是柳暗花明。

0 0 投票
给此文投票
订阅
通知
guest
0 留言
在线反馈
看所有评论
数学界的“游牧侠”:Paul Erdős 的传奇人生

Paul Erdős(1913年-1996年),匈牙利籍犹太人。1913 年 3 月 26 日出生……

概率论大师钟开莱:转益多师,成就非凡

钟开莱(1917年-2009年),1917年生于上海,祖籍浙江杭州。世界知名的概率学家、华裔数学家……

小儿中医诊疗纪实:中医疗法的温柔力量🍃👶

萧山来某和她女儿来看病时告诉我,她外甥发烧了,体温38度,略咳,无汗,两便正常。来某个子不高,女儿……

0
希望看到你的想法,请评论x