我们今天发布了一门免费在线应用数据伦理课程,其中包含了所有数据科学从业者或受技术影响者都应掌握的基本知识。本课程侧重于当前紧迫且实用的主题,这些主题正在造成现实世界的危害。秉持 fast.ai 的教学理念,我们将首先从两个活跃的现实世界领域(虚假信息和偏见)入手,提供背景和动机,然后在第三课中回过头来深入探讨数据伦理基础和实用工具。接下来,我们将进入其他主题领域:隐私与监控,硅谷生态系统的作用(包括指标、风险投资增长和超高速增长),以及算法殖民主义。
如果您现在准备开始,请查看课程大纲和阅读清单或在此处观看视频。 否则,请继续阅读以了解更多详情!
本课程无任何先决条件。它并非旨在包罗万象,但希望能提供关于数据滥用如何影响社会的有用背景知识,并锻炼批判性思维技能和提出问题的能力。本课程最初于2020年1月至2月在旧金山大学数据学院面授,学生群体多样,包括来自不同背景的职场专业人士(作为夜间证书课程的一部分)。
关于数据伦理课程大纲
数据伦理涵盖了极其广泛的主题,其中许多是当前紧迫的,每天都登上头条,并正在对现实中的人们造成伤害。一项对100多个科技伦理课程大纲的元分析,题为《教授科技伦理时我们教授什么?》,发现科技伦理课程涵盖的主题差异巨大(法律与政策、隐私与监控、哲学、正义与人权、环境影响、公民责任、机器人、虚假信息、工作与劳动力、设计、网络安全、研究伦理等等——远远超出一门课程所能涵盖的范围)。这些课程由来自不同领域的教授讲授。更具一致性的领域是学习成果,其中批判、发现问题和提出论点等能力是科技伦理课程最普遍期望的结果。
关于本课程涵盖的主题,有大量的优秀研究和著作,对我来说,将阅读清单精简到“合理”的长度非常困难。关于这些主题,还有更多精彩的文章、论文、散文和书籍未包含在此处。请在此处查看我的课程大纲和阅读清单。
关于 fastai 视频浏览器的说明
视频浏览器左上方有一个图标,可以打开包含所有课程的菜单。右上方附近的一个图标可以打开课程笔记和文字记录搜索功能。
涵盖主题
第一课:虚假信息
从被用于骚扰女性的深度伪造视频,到关于冠状病毒的广泛错误信息(被世界卫生组织标记为“信息流行病”),对虚假信息可能在2020年选举中扮演角色的担忧,以及大量外国影响行动的新闻,虚假信息频繁出现在新闻中,是一个紧迫的问题。它也表明了许多数据伦理问题的复杂性和跨学科性质:虚假信息涉及技术设计选择、恶意行为者、人类心理、不一致的财务激励等等。
在此处观看第一课视频。
第二课:偏见与公平
不公正的偏见是机器学习中日益受到讨论的问题,甚至催生了以公平、问责和透明(FAccT)为主要焦点的自身领域。我们将超越表面讨论,涵盖如何定义公平、不同类型的偏见、缓解偏见的步骤以及复杂因素等问题。
在此处观看第二课视频。
第三课:伦理基础与实用工具
现在我们已经看到了一些具体的、现实世界中数据伦理问题的例子,我们将退一步学习一些伦理哲学和评估伦理的视角,并思考如何选择伦理问题。我们还将介绍马克库拉中心(Markkula Center)的科技伦理工具包,这是一套可在工作场所实施的具体实践。
在此处观看第三课视频。
第四课:隐私与监控
关于我们的大量数据正在被收集:手机上的应用程序跟踪我们的位置,约会网站出售私密细节,学校的面部识别记录学生,警察使用大型的、不受监管的人脸数据库。在这里,我们讨论了关于我们的数据如何被收集、出售和使用的现实世界例子。此外,还有令人担忧的模式,关于如何利用监控来压制异议,并进一步伤害那些已经被边缘化的人群。
在此处观看第四课视频。
第五课:我们是如何走到这一步的?我们的生态系统
新闻报道往往可以理解地侧重于某个特定公司某个特定伦理问题的一个案例。在这里,我希望我们能退一步思考一些更广泛的趋势和因素,这些趋势和因素导致了我们正在看到的各种问题。这些包括我们对指标的过度强调、许多平台的固有设计、风险投资对超高速增长的关注等等。
在此处观看第五课视频。
第六课:算法殖民主义及后续步骤
当一个国家的公司在许多其他国家开发和部署技术,提取数据和利润,而往往对当地文化问题知之甚少时,可能会产生许多伦理问题。在这里,我们将探讨算法殖民主义。我们还将考虑学生如何继续参与数据伦理,并将所学知识带回工作场所的后续步骤。
在此处观看第六课视频。