读当我点击时,算法在想什么?03算法在监视我们(下)
1. 没有公平,只有悖论
1.1. 这个世界上不存在公平的方程式
1.2. 公平只是人类的美好愿望,它是我们的一种感觉
1.3. 数学的美妙之处在于我们可以通过它证明普适的结论
- 1.3.1. 每当我们为了做正确的事情而向数学求助的时候,它给我们的答案始终如一:公平不止源于逻辑
1.4. 肯尼斯·阿罗(Kenneth Arrow)的“不可能性定理”(impossibility theorem)告诉我们,不存在一个制度能够让人们在三个政治候选人之间进行选择时,又公平地反映所有投票者的喜好
1.5. “不作恶”(Don’tbe evil),但现在谷歌公司却不怎么提它
1.6. 我们可以全力以赴,但永远无法确定我们所做的事情就是正确的
1.7. 算法中的偏见与歧视
-
1.7.1. 不太担心算法会对我们做出精确得可怕的预测,而是更担心人们推销算法的方法
-
1.7.2. 误报
- 1.7.2.1. False Positive,也称假阳性
-
1.7.3. 漏报
- 1.7.3.1. False Negative,也称假阴性
-
1.7.4. 当我们生活在一个方方面面都不公平的世界中时,我们就不能指望我们的算法完全公平
2. COMPAS算法
2.1. COMPAS是一个黑箱,这意味着人们很难,甚至无法对其内部一探究竟
2.2. COMPAS算法的发明人蒂姆·布伦南(Tim Brennan)是该算法的供应商Northpointe公司的董事
2.3. 首先使用主成分分析法旋转和降维数据,然后使用根据过往记录做出的回归模型来预测某个犯人是否会再次犯罪
2.4. 差异本身并不意味着该算法存在偏见,因为在黑人和白人犯人中,再次犯罪的比例有所不同
-
2.4.1. 52.6%的黑人罪犯在两年内因另一项罪行被逮捕
-
2.4.2. 仅有 39.4%的白人罪犯因另一项罪行被抓
2.5. 误报指的是一个不会在未来犯罪的人被列为高风险罪犯的情况,也就是说模型做出了肯定却错误的预测
- 2.5.1. 误报却意味着你可能被拒绝假释或者被判比应得刑期更长的监禁时间
2.6. 误报率指那些没有再次犯罪却被列为高风险罪犯的人数除以未再犯的总人数
2.7. 真阳性(True Positive)的判断是公平的:算法预测你存在犯罪风险,而你也确实如此
2.8. 发生在白人罪犯身上的则更多的是漏报,即某个人被归入了低风险人群,但他却再次犯罪
-
2.8.1. 白人罪犯的漏报率是461/966≈47.7%
-
2.8.2. 黑人罪犯则是 532/1 901≈28.0%
2.9. 高漏报率意味着很多本应被拘留的人却重新获得自由并犯下了罪行,这对于社会来说是一个严重问题
- 2.9.1. 几乎有一半再次犯罪的白人在评估中被算法贴上了低风险的标签
2.10. 黑人有可能因为它被无辜地判以更久的刑期,而会犯下更多罪行的白人则被释放
2.11. 任何其他结果都表明这个算法对这两个种族做了不公平的校准,因为那意味着它必须对白人和黑人罪犯使用不同的评估方法
3. 数据炼金术士
3.1. 算法在数以百计的维度中“思考”,处理海量数据,并了解我们的行为
3.2. 当需要理解这个世界的时候,数学模型通常战胜不了人类
3.3. 主观属性可以通过听歌环节进行量化,在这个过程中人类实验对象会聆听成组的歌曲,并说出他们认为最悲伤或最适合跳舞的一首歌
3.4. 数据炼金术这个概念完美地体现了现代数字营销的运作方式
3.5. 最简单的方法往往就是最好的
3.6. 关于公司滥用私人信息的阴谋论不太可能站得住脚
- 3.6.1. 更合理的解释是,数据炼金术士们发现了我们行为中的统计关系,并帮助这些公司向我们推送定向广告
3.7. “阴魂不散”的广告还有另一个主要来源,那就是重定向
-
3.7.1. 我们搜索过阿尔加维的旅行,只是忘记了
-
3.7.2. 但是网络浏览器却已经记住这些信息并反馈给了XY集团,于是后者根据这些信息为我们推荐最好的酒店房间
3.8. 我们长时间盯着我们的手机和屏幕,这使得广告似乎能够不时地读懂我们的想法
3.9. 真正聪明的并不是算法
-
3.9.1. 这些才智来自数据炼金术士,他们把数据和自己对客户的理解相结合
-
3.9.2. 由于算法的预测依赖于点“赞”的数据,它对我们行为的预测,在精确性上不及我们身边的人
-
3.9.3. 只有被了解其局限性的人使用,算法才能发挥它最大的作用
4. 业余人士打败了算法
4.1. 人类总是理所当然地认为技术是客观公正的,所以那些技术未能带来公正的时候往往是最危险的时候
4.2. 一个被广泛用于预测再犯的大型商业软件,并不比那些几乎没有刑事审判经验的人根据在线调查问卷结果所做的预测更准确、更公平
4.3. 结论并不意味着算法毫无用武之地
-
4.3.1. 如果算法的表现与人类的水平相同,那么计算机就会获胜,因为它们处理数据的速度远非人类可比
-
4.3.2. 模型虽然远远不够完美,但确实非常有用
4.4. 对许多犯人来说,接受面谈和评估是一个有损人格的过程,然而这个过程似乎并没有提高再犯率预测的水平
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
2024-02-17 读十堂极简人工智能课笔记04_计算机视觉
2023-02-17 读Java实战(第二版)笔记12_重构、测试和调试