我最近作为客座讲者参加了斯坦福人工智能沙龙,讨论了人工智能可及性的话题,其中包括斯坦福人工智能实验室成员之间的自由讨论。会上提出了一些有趣的问题和话题,所以我想在这里分享我的一些回答。
问: 关于人工智能,您最想让大众了解的3件事是什么?
答: 1. 人工智能比炒作让你相信的更容易使用。 在麻省理工科技评论大会上我的近期演讲中,我驳斥了几个常见误解,即认为使用人工智能必须拥有博士学位、庞大数据集或昂贵的计算能力。
大多数人工智能研究人员并非致力于让计算机实现人类意识。 人工智能是一个极其广泛的领域,对于其中包含的许多内容来说,这个名称有点误导(尽管既然这是所有人都在用的术语,我也沿用)。上周,我和一位NPR记者聊了20分钟,才意识到他以为我们在谈论计算机系统实现人类意识,而我以为我们在谈论Facebook用来决定向你展示哪些广告的算法。这类事情屡见不鲜。
95%的时间里,人工智能领域内的人谈论人工智能时,指的是执行特定任务的算法(例如 对照片排序、翻译语言或赢得Atari游戏);而95%的时间里,人工智能领域外的人听到关于人工智能的消息时,他们会想到人形机器人实现超级智能(这些数字是基于我的经验估算的)。我认为这导致了许多不必要的困惑和恐惧。
有一些问题比邪恶超级智能的威胁更加紧迫,例如我们如何将种族和性别偏见编码进算法中(这些算法越来越多地用于做出招聘、解雇、医疗福利、刑事司法和其他影响生活的决定),或者如何加剧不平等(以及算法在此中的持续和加速作用)。
此外,去年我写了一篇博文,列出了面向大众的可靠的人工智能准确信息来源,对于希望了解更多的人来说,这可能是一个便利的资源。
我们完全同意 @ai4allorg ! @math_rachel 关于进入人工智能的门槛比你想象的要低的精彩演讲。@fastdotai #EmTechDigital pic.twitter.com/sai8nXkXaF
— Tess Posner (@tessposner) 2018年3月27日
问: 人工智能研究人员可以做些什么来提高可及性?
答: 我希望人工智能研究人员能做到以下几点
- 为你的论文写一篇配套的博文(我们给 fast.ai 学生关于阅读学术论文的一些建议是,首先搜索是否有人写了博文版本)
- 分享你的代码。
- 尝试在单块GPU上运行你的代码(这是大多数人可以访问的)。Jeremy和我有时会遇到明显从未在单块GPU上运行过的代码。
- 在你的论文中使用具体示例。我最近在读一篇关于公平性的论文,里面全是数学方程,即使我拥有数学博士学位,也难以将其含义映射到现实世界中。
问: 我最近教了一门深度学习课程,让所有学生做自己的项目。这太难了。学生们无法让他们的模型训练起来,我们只能说“这就是深度学习”。fast.ai 是如何做到教授这门课的呢?
答: 是的,深度学习模型在训练时出了名的挑剔。fast.ai 诞生了许多成功的学生项目,我相信其中一些因素包括
- fast.ai 课程围绕大量实用的、动手实践的案例研究(涵盖计算机视觉、自然语言处理、推荐系统和时间序列问题)构建,我认为这为学生的许多项目提供了良好的起点。
- 我们开发了 fastai 库,其主要目标是让学生易于使用并应用于新问题。这包括学习率查找器、设置良好默认值以及编码最佳实践(如循环学习率)等创新。
- fast.ai 不是一家教育公司;我们是一个研究实验室,我们的研究主要集中在如何让深度学习更容易使用(这与让深度学习更容易学习的目标紧密一致)。
- 话虽如此,我确实想承认,深度学习模型的训练仍然可能令人沮丧和挑剔!我认为在这个领域工作的每个人都会经常经历这些挫折(随着该领域的成熟和发展,我期待情况有所改善)。
问: 您说的人工智能可及性是什么意思?为什么它很重要?
答: 我说的可及性是指,来自各种背景的人:学历、居住地、专业领域、种族、性别、年龄等等,都应该能够将人工智能应用于他们关心的问题。
我认为这很重要,原因主要有两个
- 积极的一面是,来自不同背景的人会知道并关心其他人不知道的问题。例如,今年秋天我们有一位学生是加拿大奶农,他正在使用深度学习改善奶山羊的乳房健康。这是一个我从未想过的应用场景。
- 不同背景的人对于尝试发现人工智能的偏见和负面影响至关重要。我认为来自代表性不足背景的人最有可能识别出人工智能可能有害的方式,因此他们的参与至关重要。
我还希望各种背景的人都能对人工智能有足够的了解,以便能够识别出何时有人在兜售假冒伪劣产品(或者只是过度承诺他们能够合理实现的东西)。
目前,对于我们的面向程序员的实用深度学习课程,你需要1年的编程经验才能学习深度学习,尽管我们正在努力降低这一入门门槛。我还没有了解声称无需编程即可使用深度学习的最新版本深度学习SAAS API(这在我的待办事项清单上),但是我上次查看时,这些API存在一些缺点
- 无法真正达到最先进的结果(为此,你需要自己编写代码),而这才是大多数人想要的
- 只适用于相当有限的问题,或者
- 为了有效使用API,你需要了解的知识量几乎和自己编写代码一样多(在这种情况下,人们更喜欢自己编写代码,因为这给了他们更多的控制权和定制能力)。
虽然我支持任何人都能够使用的机器学习API的长远愿景,但我怀疑目前的技术是否足以真正提供一个强大且性能卓越到可以取代代码的东西。
问: 我们真的需要每个人都理解人工智能吗?如果目标是让界面像汽车一样用户友好,我们是否应该只关注这一点?汽车有很好的用户界面,我们都可以驾驶汽车而无需了解引擎如何工作。最初是谁开发了汽车,这真的重要吗?
答: 虽然我同意让深度学习像使用汽车一样容易的长期目标,但我认为我们离此还很远,并且在此期间由谁参与开发非常重要。让一个同质化的群体来开发影响我们所有人的技术是危险的。
例如,直到2011年,汽车制造商才被要求除了使用“标准”男性碰撞测试假人外,还要使用具有典型女性解剖结构的碰撞测试假人(我从 Timnit Gebru 等人的《数据集的数据表》中学到这一事实,其中包含了关于电子、汽车和制药行业如何实现标准化的引人入胜的案例研究)。正如该论文中所述,“一项对1998年至2008年间生产的汽车进行的安全性研究得出结论,系安全带的女性在类似事故中遭受重伤的可能性比男性高出47%”。
进一步扩展汽车类比,我们的汽车系统及其发展方式存在许多次优之处:美国对公共交通的投资不足,免费停车如何导致城市蔓延和拥堵,以及优先选择化石燃料而非电力造成的负面影响。如果参与汽车开发的人来自更广泛的背景和领域,这些情况是否会有所不同?
最后,回到人工智能可用性和可及性的问题,这两点都很重要
- 谁帮助创建抽象和可用性接口
- 在此期间谁能够使用人工智能。
问: 人们真的能够自学他们需要的数学知识吗?通过线下课程学习是不是更容易?那么作为一名斯坦福的研究生,我是否应该利用我现在可以接触到的数学课程?
答: 在 fast.ai,我们强烈建议人们按需学习数学(也可以看看这里和这里)。觉得你必须在你感兴趣的主题开始之前学习所有你可能需要的数学,这是一种导致气馁的方法,而且大多数人难以保持动力。如果你的目标是将深度学习应用于实际问题,那么很多数学知识最终证明是不必要的。
至于通过线下课程是否学得更好,这是我思考的一个问题。尽管我们将所有课程材料都放在线上并免费提供,但仍有一些学生从其他国家(包括澳大利亚、阿根廷、英格兰和印度)前来参加我们的线下课程。如果你正在学习在线或远程课程,我强烈建议你尝试与你所在地区的其他人组织一个线下学习小组。无论如何,都要寻求在线社区的支持。
我拥有数学博士学位,所以在研究生阶段学习了很多数学。遗憾的是,我忘记了许多我没有使用的东西(我的大多数研究生课程都是十多年前学的)。考虑到我现在所从事的工作,这并不是对时间的有效利用。所以,我不知道去上一门你可能不需要的课程有多大用处(除非你完全是出于兴趣,或者你打算留在学术界)。
最后,在与学生的交流中,我认为人们对数学的焦虑和负面情绪是比未能理解概念更大的问题。美国的数学教学方法和相关文化有很多不足之处,因此许多人有这种感觉是可以理解的。
这只是我们在人工智能沙龙讨论的众多话题中的一部分。所有问题都是我根据记忆复述的,并非原话。我还应该指出,我的共同演讲者,斯坦福博士后 Mark Whiting,就 HCI 和符号系统提出了一些有趣的观点。我非常享受这次活动,并想感谢组织者邀请我!