会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
躺柒
博客园
首页
新随笔
联系
订阅
管理
读算法霸权笔记02_盲点炸弹
盲点炸弹
合集 - 读算法霸权(13)
1.
读算法霸权笔记
13_读后总结与感想兼导读
2024-01-10
2.
读算法霸权笔记
01_数学杀伤性武器
2023-12-23
3.
读算法霸权笔记
02_盲点炸弹
2023-12-24
4.
读算法霸权笔记
03_操控与恐吓
2023-12-25
5.
读算法霸权笔记
04_排名模型
2023-12-27
6.
读算法霸权笔记
05_掠夺式广告
2023-12-28
7.
读算法霸权笔记
06_犯罪预测
2023-12-29
8.
读算法霸权笔记
07_筛选
2023-12-30
9.
读算法霸权笔记
08_反馈
2023-12-31
10.
读算法霸权笔记
09_信用数据的陷阱
2024-01-02
11.
读算法霸权笔记
10_分类与群体
2024-01-04
12.
读算法霸权笔记
11_微目标
2024-01-05
13.
读算法霸权笔记
12_数据科学
2024-01-06
1. 棒球模型
1.1. 棒球运动特别适合建立预测性数学模型
1.2. 棒球模型之所以公平,部分原因在于其模型是透明的
1.2.1. 每个人都可以获取作为模型根据的数据,并且或多或少能够理解模型的结果应该怎么解读
1.3. 棒球的统计也比较严谨
1.3.1. 棒球专家手中掌握大量数据,而且几乎所有的数据都和球员的表现直接相关
1.3.2. 他们的数据和他们根据模型预测的结果高度相关
1.3.3. 大多数棒球模型则不使用间接变量,它们只利用最直接的相关信息
1.3.3.1. 坏球、好球和安打的次数
1.3.4. 新的棒球数据还在不断涌入
1.3.4.1. 每年的4~10月,每天都有十二三场比赛的新数据涌入记录系统
1.3.4.2. 统计学家可以将这些比赛结果和他们开发的模型的预测结果进行比较,以找出模型哪里出了问题
1.3.5. 棒球运动模型追求细节,并且不断更新
1.3.5.1. 不透明的教师评估模型则似乎建立在少量的考试成绩数据之上
1.4. 基本上是一种健康模型
1.4.1. 模型信息透明,不断更新,假设和结论大家都可以看到
2. 可靠模型
2.1. 可靠模型的开发者会对自己想要理解或者想要预测的所有事情进行反复的核实查证,并且模型必须随着具体情况的改变而改变
2.2. 模型的本质就是简化
2.2.1. 没有模型能囊括现实世界的所有复杂因素或者人类交流上的所有细微差别
2.2.2. 有些信息会不可避免地被遗漏
2.2.3. 错误总会出现
2.3. 接受模型偶尔会像一个愚蠢的机器一样存在很多信息盲点
2.4. 有时候,盲点不重要
2.4.1. 谷歌给出的世界模型就只有道路、隧道、桥梁,而忽略了建筑物
2.4.1.1. 因为建筑物和我们想要的答案无关
2.4.2. 利用航空电子软件指导飞机飞行时,该软件给出的世界模型就只包含风、飞行速度和地面的着陆带,而不会显示街道、隧道、建筑物和人
2.5. 一个模型是否奏效也见仁见智
2.5.1. 不管是正式模型还是非正式模型,关键要素都是其对某事成功或符合标准的定义
2.6. 一些非常有效的模型可能只有一个变量
2.6.1. 最常见的家用或办公室火灾探测模型就只测量一个与火灾密切相关的变量:烟的出现
2.7. 种族主义在个人层面上可以被视为在全世界数十亿人的大脑中快速运转的预言模型
2.7.1. 这种模型是基于有缺陷的、不完整的或是笼统的数据建立的
2.7.2. 这种模型产生了一种二元论的预测
2.7.2.1. 即某一种族的所有人都行为恶劣,非该种族的人则没有这一特点
2.7.2.2. 种族主义者不会花大量时间搜集可靠数据修改他们扭曲的模型
2.7.2.2.1. 他们的模型一旦变成一种信仰,就从此固定不变了
2.7.3. 种族主义是最欠考虑的预测模型,它由随机的数据采集和假性相关所驱动,被制度不公平加以强化,又被证实性偏见加以进一步劣化
2.7.4. 不管在审判时包含种族因素的证词是否被明确提出,很长一段时间里,种族都是影响审判结果的一个主要因素
2.7.4.1. 瓦特·基哈诺的公开证词
3. 再犯风险模型
3.1. 不透明、隐形成了这类模型的规则
3.2. 利用电子化、数据化的再犯风险模型辅助判决能减少偏见对判刑的影响,更有利于实现公正判决
3.3. 再犯模型的开发是一种进步,它使得审判更具一致性,更少被法官的情绪和偏见所影响
3.4. 问题是,我们是彻底根除了人类偏见,还是只不过用技术包装了人类偏见?
3.4.1. 瓦特·基哈诺的公开证词在被转录成文字之后,还可以供他人在法庭上阅读和质疑
3.4.2. 一个再犯模型的运作完全是由算法独立完成的,只有极少数专业人士能理解
4. LSI–R(水平评估量表)
4.1. 一个更普及的用于评估罪犯危险性的模型
4.2. 其中包含一个需要罪犯填写的冗长的问卷
4.2.1. 有特权背景的罪犯和来自治安差的城市贫民区的罪犯,他们的答案肯定不一样
4.2.2. 不像大多数富人孩子,穷人和少数族裔总会因为这些小事遭遇麻烦
4.2.3. 如果曾在早期“遭遇”过几次警察就表示一个犯人是惯犯,这对穷人和少数族裔是很不公平的
4.3. 得到“高风险”评分等级的人很可能本来就是失业人员,在其所生活的社区里,他的许多朋友和家人都触犯过法律
4.3.1. 得到这一评级是导致其刑期变长的一个原因,而多年和一群罪犯关在一起又增加了他再次犯罪的可能性
4.3.2. 等他出狱之后,他又会回到同样的贫穷社区,而这一次还有了犯罪记录,对他而言,找工作变得更难了
4.3.3. 正是这一模型本身导致了犯人陷入恶性循环,并且进一步巩固了犯人的恶劣处境
4.3.3.1. 数学杀伤性武器的典型特点
4.4. 20世纪90年代建立该模型的人认为,LSI–R是提高刑事司法系统的公平和效率的一个有效工具
4.4.1. 导致一部分人受苦的关键原因是模型造成的恶性循环
4.5. 罪犯为数据科学家提供了一整个活跃的市场
4.5.1. 刑罚体系积累了大量数据,因为罪犯比平常人享有更少的隐私权
4.5.2. 刑罚体系因为太过于臃肿、低效、高成本、缺乏人性而亟待改进
5. 即使模型是良性模型,不透明还是给人一种不公平的感觉
5.1. 如果你在进入一个露天音乐会现场之后,导引员跟你说你不能坐在前十排,你会觉得这很不合理
5.2. 如果导引员跟你解释前十排是为行动不便的人保留的,那你的感觉就大不一样了
5.3. 透明很重要
5.4. 现实是,许多公司竭尽所能地隐藏它们的模型运算结果,甚至隐藏模型的存在
5.4.1. 常见的一个辩护理由就是模型算法包含对它们的业务至关重要的“商业机密”
5.4.2. 知识产权,如果有必要,公司必须在大批律师和说客的协助下为其维护算法机密性的行为进行辩护
6. 不断发展的数学杀伤性武器
6.1. 不断发展的数学杀伤性武器在人力资源、健康、银行等数不尽的行业快速确立普适准则,继而对我们产生一种非常类似于法律的权威性影响
6.2. 特征
6.2.1. 不透明
6.2.1.1. 评分算法是隐藏的
6.2.2. 规模化
6.2.3. 毁灭性
6.3. 并不是所有的数学杀伤性武器都是有害的
6.3.1. 重点不是有没有人受益,而是有很多人受害
6.3.2. 数学杀伤性武器关闭了亿万人的机会之门,通常只是因为一些微不足道的理由,而且不予他们上诉的机会
6.4. 算法能从一个领域跳跃性地应用于另一个领域,而且经常如此
6.4.1. 传染病学研究中的模型被用于预测票房
6.4.2. 垃圾邮件过滤器的模型被用于发现艾滋病病毒
合集:
读算法霸权
好文要顶
关注我
收藏该文
微信分享
躺柒
粉丝 -
50
关注 -
0
+加关注
0
0
升级成为会员
«
上一篇:
读算法霸权笔记01_数学杀伤性武器
»
下一篇:
读算法霸权笔记03_操控与恐吓
posted @
2023-12-24 09:37
躺柒
阅读(
37
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
登录后才能查看或发表评论,立即
登录
或者
逛逛
博客园首页
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
相关博文:
·
读算法霸权笔记12_数据科学
·
读算法霸权笔记06_犯罪预测
·
沃顿商学院商业人工智能笔记-九-
·
MIT-6-S897-医疗机器学习-2019-中文笔记-三-
·
UCB Data100:数据科学的原理和技巧:第十一章到第十五章
阅读排行:
·
【.NET】调用本地 Deepseek 模型
·
CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
·
DeepSeek “源神”启动!「GitHub 热点速览」
·
Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
·
我与微信审核的“相爱相杀”看个人小程序副业
公告
昵称:
躺柒
园龄:
2年1个月
粉丝:
50
关注:
0
+加关注
<
2025年2月
>
日
一
二
三
四
五
六
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
合集
学信息系统项目管理师第4版(35)
学系统集成项目管理工程师(中项)(43)
读高性能MySQL(第4版)(21)
读发布!设计与部署稳定的分布式系统(第2版)(34)
随笔及总结(26)
读改变未来的九大算法(10)
读数据压缩入门(11)
读C#代码整洁之道(8)
读编程与类型系统(12)
读函数式编程思维(6)
读Java8函数式编程(9)
读Java实战(第二版)(20)
读Java性能权威指南(第2版)(31)
读SQL进阶教程(17)
选读SQL经典实例(23)
读SQL学习指南(第3版)(13)
读图数据库实战(11)
读程序员的制胜技(15)
读像火箭科学家一样思考(16)
读程序员的README(19)
读算法霸权(13)
读元宇宙改变一切(14)
读AI3.0(10)
读千脑智能(13)
读十堂极简人工智能课(9)
读人工不智能:计算机如何误解世界(10)
读算法的陷阱:超级平台、算法垄断与场景欺骗(20)
读所罗门的密码(21)
读天才与算法:人脑与AI的数学思维(26)
读人工智能时代与人类未来(19)
读AI未来进行式(12)
读AI新生:破解人机共存密码(18)
读人工智能全传(16)
读写给大家的AI极简史(7)
读零信任网络:在不可信网络中构建安全系统(21)
读软件开发安全之道:概念、设计与实施(17)
读软件设计的要素(7)
读构建可扩展分布式系统:方法与实践(16)
读数据湖仓(9)
读数据工程之道:设计和构建健壮的数据系统(34)
读数据质量管理:数据可靠性与数据质量问题解决之道(20)
读数据保护:工作负载的可恢复性(31)
读量子霸权(18)
读算法简史:从美索不达米亚到人工智能时代(15)
读当我点击时,算法在想什么?(7)
读DAMA数据管理知识体系指南(4)
更多
随笔档案
2025年2月(25)
2025年1月(31)
2024年12月(31)
2024年11月(30)
2024年10月(31)
2024年9月(30)
2024年8月(31)
2024年7月(31)
2024年6月(30)
2024年5月(31)
2024年4月(30)
2024年3月(31)
2024年2月(29)
2024年1月(31)
2023年12月(31)
2023年11月(30)
2023年10月(31)
2023年9月(30)
2023年8月(31)
2023年7月(31)
2023年6月(30)
2023年5月(31)
2023年4月(31)
2023年3月(36)
2023年2月(28)
2023年1月(26)
阅读排行榜
1. C#代码整洁之道读后总结与感想(599)
2. 选读SQL经典实例笔记01_检索和排序(369)
3. 读C#代码整洁之道笔记01_C#的编码标准和原则(311)
4. 读C#代码整洁之道笔记04_重构C#代码识别代码坏味道(309)
5. 学信息系统项目管理师第4版系列02_法律法规(268)
评论排行榜
1. 2023年1月随笔(11)
2. 2023年10月随笔之婚宴趣事多(2)
3. 读高性能MySQL(第4版)笔记12_查询性能优化(下)(2)
4. 读Java性能权威指南(第2版)笔记18_垃圾回收E(2)
推荐排行榜
1. 读高性能MySQL(第4版)笔记01_MySQL架构(上)(2)
2. 选读SQL经典实例笔记01_检索和排序(2)
3. 读软件设计的要素01概念(1)
4. 读AI未来进行式笔记01深度学习(1)
5. 读所罗门的密码笔记01_当人类遇见机器(1)
最新评论
1. Re:2023年10月随笔之婚宴趣事多
@gz4621 wondershare mindmaster...
--躺柒
2. Re:2023年10月随笔之婚宴趣事多
大神 思维导图用的什么软件制作的?
--gz4621
3. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
@东围居士 建议读新版。...
--躺柒
4. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
第4版相比第3版好像缩减了好多内容?楼主推荐第3版还是第4版
--东围居士
5. Re:读Java性能权威指南(第2版)笔记18_垃圾回收E
@屠炉 没有用第三方工具,手动的。 有几个平台直接支持markdown导入,只是要调整一下图片上传即可。...
--躺柒
点击右上角即可分享
支持DeepSeek的编程助手
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 我与微信审核的“相爱相杀”看个人小程序副业