会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
躺柒
博客园
首页
新随笔
联系
订阅
管理
随笔 - 788
文章 - 0
评论 - 17
阅读 -
49126
读算法霸权笔记06_犯罪预测
犯罪预测模型
合集 - 读算法霸权(13)
1.
读算法霸权笔记
13_读后总结与感想兼导读
2024-01-10
2.
读算法霸权笔记
01_数学杀伤性武器
2023-12-23
3.
读算法霸权笔记
02_盲点炸弹
2023-12-24
4.
读算法霸权笔记
03_操控与恐吓
2023-12-25
5.
读算法霸权笔记
04_排名模型
2023-12-27
6.
读算法霸权笔记
05_掠夺式广告
2023-12-28
7.
读算法霸权笔记
06_犯罪预测
2023-12-29
8.
读算法霸权笔记
07_筛选
2023-12-30
9.
读算法霸权笔记
08_反馈
2023-12-31
10.
读算法霸权笔记
09_信用数据的陷阱
2024-01-02
11.
读算法霸权笔记
10_分类与群体
2024-01-04
12.
读算法霸权笔记
11_微目标
2024-01-05
13.
读算法霸权笔记
12_数据科学
2024-01-06
1. 犯罪预测软件
1.1. 该软件根据地区的历史犯罪数据,按小时计算最可能发生犯罪的地点
1.2. 该软件预测出的犯罪地点可被看作一块相当于两个足球场那么大的正方形区域
1.3. 如果警方在相应的时间在这些预测区域安排更多警力巡逻,那么他们就很有可能阻止犯罪的发生
1.3.1. 一年后,盗窃率下降了23%
1.4. 和其他大数据行业一样,犯罪预测软件的开发人员也忙于搜集所有能提高其模型的预测准确性的信息
1.5. 原理就借鉴自地震预测软件
1.5.1. 研究一个地区的犯罪发生情况,将其整合到已有的历史模式中,以此预测下一次该地区的犯罪事件可能发生的时间和地点
1.5.2. 如果窃贼袭击了你隔壁邻居的房子,那你也要做好准备了
1.6. 第1类犯罪
1.6.1. 包括杀人、纵火和人身侵犯
1.6.2. 这些犯罪事件通常都是必须被警方记录在案的
1.7. 第2类犯罪
1.7.1. 流浪、侵犯型乞讨、贩卖和消费少量毒品等
1.7.2. 如果不是警察就在现场,这种轻微的妨害罪通常不会被记录在案
1.7.3. 这些轻微的妨害罪在许多贫困社区都很常见
1.7.4. 在有些地方,警察称之为“反社会行为”,简称ASB
1.7.5. 在模型中囊括这些妨害罪的数据会导致预测结果发生巨大偏差
1.7.5.1. 当这些轻微犯罪被更多地记录在案时,警方的犯罪预测模型中就会出现越来越多的此类数据点
1.7.5.2. 警察将被再次派往这些轻微犯罪高发的贫困社区
1.7.5.3. 恶性循环
1.7.5.3.1. 警方自身不断制造新数据,证明了对贫困社区加大警力的合理性
1.8. 模型致力于优化资源配置
1.9. 模型并不关注个人,它关注的是地理位置
1.9.1. 从统计学上来说,“物以类聚,人以群分”是对的
1.9.2. 模型没有将种族和民族作为指标纳入其中
1.9.3. 美国监狱里则挤满了成千上万个妨害罪罪犯
1.9.3.1. 他们大多数来自贫困社区,很多是黑人或拉美族裔
1.9.3.2. 即使这类模型不关心种族因素,其结果仍然体现了种族偏差
1.9.3.3. 过度拥挤的监狱系统有巨额利润可图
1.9.4. 在存在种族隔离的城市中,地理位置是种族的一个非常有效的替代变量
1.10. 模型最擅长预测轻微犯罪
1.10.1. 实际上,在世界各地应用该类模型都将导向这个结果
1.10.2. 纳入轻微犯罪数据的模型则会“完美”地呈现出一个治安混乱的城市面貌
1.10.3. 在大多数地区,这样的犯罪地图将与该地区的贫富分布图大幅重叠
1.10.3.1. 由此得出的贫困地区犯罪率高的结论只能证实并强化社会中上层阶级的普遍观点:穷人要为自己的境遇负责,大部分坏事都是穷人干的
1.10.4. 醉汉总会在同一面墙上尿尿
1.10.5. 瘾君子总会睡在同一个公园的长椅上
1.10.6. 偷车贼或抢劫犯则总会四处走动,试图预测警察的动向
1.11. 出于最高尚的初衷的一个会自行发展的数学杀伤性武器
1.11.1. 授权了警察局锁定穷人、拦截穷人、逮捕穷人,并把其中的一部分穷人罪犯关进监狱
1.11.2. 指着地图上的贫困社区说,这就是犯罪高发地
1.11.3. 先进的大数据技术为他们一贯以来的观念赋予了精确性和“科学性”
1.11.4. 我们一边将贫困视为犯罪,一边相信我们的工具既科学又公平
2. 拦截—搜身政策
2.1. “拦截—搜身”并不完全是一种数学杀伤性武器
2.1.1. 因为该政策依赖于人的判断,并没有被程序化
2.1.1.1. 大约85%被拦截的人是非洲裔或拉美裔的年轻人
2.1.1.2. 一些被拦截的无辜民众由于对此遭遇感到过于愤怒而进行了激烈反抗,这些人最终反倒因此而被指控拒捕
2.1.1.3. 黑人男性入狱的可能性是白人男性的6倍
2.1.1.4. 被警察击毙的可能性是白人的21倍
2.1.2. 但此政策建立在一个简单却极具破坏性的算法之上
2.1.2.1. 如果基数足够大,即使命中率很小,你仍然能实现你的目标
2.1.2.2. 如果被拦截的人增加6倍,被逮捕的人也能随之增加6倍,那么成千上万无辜的人所遭受的不便和骚扰就会被认为是合理的牺牲
2.2. 政策的主要受害者少数族裔却被警方记录在案,他们中的一些人甚至因此被发配到监狱
2.2.1. 每一次逮捕都创造了新的数据,这又进一步证明了这一政策的正当性
2.3. 要求对巡逻警察的行动予以录像,这将有助于确定某次行动是否有合理根据的,并在一定程度上消除“拦截—搜身”模型的不透明性
2.3.1. 对改善不公平的治安管理体制并没有产生根本性的影响
3. 破窗理论与社会治安
3.1. 犯罪学家乔治·凯林与公共政策专家詹姆斯·威尔逊于1982年在《大西洋月刊》上发表的关于“破窗理论与社会治安”的文章
3.1.1. 反社会行为与犯罪之间存在必然联系
3.2. 低级犯罪和轻罪造就了一个混乱的社区氛围,吓走了守法的公民,留下了黑暗和空荡的街道
3.2.1. 这些地方正是滋生严重犯罪的温床
3.3. 应对办法是阻止无序的蔓延,包括修复破碎的窗户,清理涂满涂鸦的地铁车厢,采取措施阻止轻微犯罪等
3.3.1. 纽约市的警察会因为地铁逃票而逮捕孩子,甚至连在场的逃票者的朋友也全都不放过,警车会在城市里轰隆隆地行驶几个小时,直到把他们全部逮捕归案
3.4. 破窗理论引发了20世纪90年代各地的“零容忍”运动热潮
3.5. 破窗理论和零容忍运动也都分别代表了一类模型
4. 金融领域犯罪
4.1. 警察所有的培训、装备,从上岗训练到防弹背心,都只适用于小街小巷
4.1.1. 不具备开展金融领域行动的专业技能
4.2. 警察可以主动选择把关注点放在哪儿
4.2.1. 他们几乎只关注穷人
4.2.1.1. 是他们的一贯作风
4.2.1.2. 是他们自己认为的使命所在
4.3. 金融界的驱动目标是赚取巨额利润
4.3.1. 越多越好
4.4. 由于金融界拥有巨额财富和强大的游说集团,金融行业在很大程度上并不处在监管之下
4.5. 打击白领犯罪需要的是完全不同的工具和专业人才
4.5.1. 美国联邦调查局和证券交易委员会的调查组负责打击此类罪行的资金不足的小团队从几十年前就知道,银行家实际上是无懈可击的
4.5.1.1. 除了一些像庞氏骗局操作者伯纳德·马多夫这样的极端罪犯,金融家是不会被逮捕的
4.5.1.2. 这个群体在2008年的市场崩盘中几乎毫发无损,现在又能拿他们怎么样
5. 效率和公平与平等
5.1. 宪法的隐含判断是,相比监禁或处决一个无辜的人,因缺乏证据释放一个很可能犯了罪的人对我们的社会造成的危害更小
5.2. 无罪推定是一个约束条件,其带来的副作用让一些确实有罪的人被判无罪释放,特别是那些能够请得起优秀律师的人
5.3. 数学杀伤性武器更倾向于效率
5.3.1. 数学杀伤性武器建基于可测量和可计算的数据
5.4. 公平是模糊的,很难量化,它是一个抽象概念
5.4.1. 计算机还完全不理解公平这个概念
5.4.2. 程序员不知道该如何为公平编码,他们的老板也很少会要求他们做这件事
5.5. 公平的概念没能被编入数学杀伤性武器,这导致了大规模的、产业化的不公平
5.6. 如果你把数学杀伤性武器想象成工厂,那么不公平就是那些从烟囱里冒出来的黑色排放物。这些黑色排放物是有毒的
5.7. 正义的关键是平等
5.7.1. 正义不能仅仅由社会的一部分人强加给另一部分
5.8. 被拦截、被指控、被逮捕归案并被记录到司法系统中,并不意味着“拦截—搜身”政策或犯罪预测模型所造成的恶性循环就此结束
5.8.1. 不公平的治安管理体系所产生的不公正的数据现在都集中到了这一模型中
5.8.2. 比起刑满释放后回到富人区的金融诈骗犯,刑满释放后回到穷困社区的罪犯再次触犯法律的可能性也更高,这是毫无疑问的
5.9. 刑事司法系统不去分析监狱、优化监狱,而是把监狱隐藏起来,把它变成一个黑盒子
5.9.1. 坚持一个依据可疑却不容置疑的假设,即高风险囚犯的囚禁时间越长,我们就越安全
5.9.2. 如果有研究旨在推翻这种假设,那么这种研究很容易就被忽视了
5.9.3. 在得克萨斯州哈里斯县,服刑时间越长,囚犯在获释后找不到工作的可能性就越大,因此他们就需要更多的食品券和其他的公共援助,而且更可能会犯下更多的罪行
5.10. 和罪犯生活在同一街区的无辜人士则因此遭受了极为不公的对待
5.10.1. 由于贫困和犯罪记录之间的紧密联系,穷人将继续受困于这些数字法网难以逃脱,而未受影响的大多数则不愿意花时间考虑这个问题
6. 数据实验室
6.1. 亚马逊有一个数据实验室
6.1.1. 专注于开发一种“再犯”模型
6.1.1.1. 希望人们反复来此网站购物
6.1.1.2. 会锁定“再犯者”,并鼓励“再犯”
6.2. 亚马逊会更频繁地针对这些人投放广告,比如经常给他们提供购物折扣
6.2.1. 如果该营销策略起效,那么这些有较高再犯分数的人就会重新购物
6.2.2. 营销结果似乎证实了亚马逊评分系统的合理性
6.3. 如果公司希望查明什么是驱使消费者再次购物的因素,数据实验室就会着手对此问题进行研究
6.4. 数据科学家不仅关注用户的地理位置和教育水平,还会考察其对于整个亚马逊销售平台的用户体验
合集:
读算法霸权
好文要顶
关注我
收藏该文
微信分享
躺柒
粉丝 -
50
关注 -
0
+加关注
0
0
升级成为会员
«
上一篇:
读算法霸权笔记05_掠夺式广告
»
下一篇:
读算法霸权笔记07_筛选
posted @
2023-12-29 06:56
躺柒
阅读(
37
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
登录后才能查看或发表评论,立即
登录
或者
逛逛
博客园首页
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
相关博文:
·
读算法霸权笔记02_盲点炸弹
·
读算法霸权笔记12_数据科学
·
fast.ai 机器学习笔记(四)
·
UCB Data100:数据科学的原理和技巧:第十一章到第十五章
·
沃顿商学院商业人工智能笔记-三-
阅读排行:
·
【.NET】调用本地 Deepseek 模型
·
CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
·
DeepSeek “源神”启动!「GitHub 热点速览」
·
Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
·
我与微信审核的“相爱相杀”看个人小程序副业
公告
昵称:
躺柒
园龄:
2年1个月
粉丝:
50
关注:
0
+加关注
<
2025年2月
>
日
一
二
三
四
五
六
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
合集
学信息系统项目管理师第4版(35)
学系统集成项目管理工程师(中项)(43)
读高性能MySQL(第4版)(21)
读发布!设计与部署稳定的分布式系统(第2版)(34)
随笔及总结(26)
读改变未来的九大算法(10)
读数据压缩入门(11)
读C#代码整洁之道(8)
读编程与类型系统(12)
读函数式编程思维(6)
读Java8函数式编程(9)
读Java实战(第二版)(20)
读Java性能权威指南(第2版)(31)
读SQL进阶教程(17)
选读SQL经典实例(23)
读SQL学习指南(第3版)(13)
读图数据库实战(11)
读程序员的制胜技(15)
读像火箭科学家一样思考(16)
读程序员的README(19)
读算法霸权(13)
读元宇宙改变一切(14)
读AI3.0(10)
读千脑智能(13)
读十堂极简人工智能课(9)
读人工不智能:计算机如何误解世界(10)
读算法的陷阱:超级平台、算法垄断与场景欺骗(20)
读所罗门的密码(21)
读天才与算法:人脑与AI的数学思维(26)
读人工智能时代与人类未来(19)
读AI未来进行式(12)
读AI新生:破解人机共存密码(18)
读人工智能全传(16)
读写给大家的AI极简史(7)
读零信任网络:在不可信网络中构建安全系统(21)
读软件开发安全之道:概念、设计与实施(17)
读软件设计的要素(7)
读构建可扩展分布式系统:方法与实践(16)
读数据湖仓(9)
读数据工程之道:设计和构建健壮的数据系统(34)
读数据质量管理:数据可靠性与数据质量问题解决之道(20)
读数据保护:工作负载的可恢复性(31)
读量子霸权(18)
读算法简史:从美索不达米亚到人工智能时代(15)
读当我点击时,算法在想什么?(7)
读DAMA数据管理知识体系指南(4)
更多
随笔档案
2025年2月(25)
2025年1月(31)
2024年12月(31)
2024年11月(30)
2024年10月(31)
2024年9月(30)
2024年8月(31)
2024年7月(31)
2024年6月(30)
2024年5月(31)
2024年4月(30)
2024年3月(31)
2024年2月(29)
2024年1月(31)
2023年12月(31)
2023年11月(30)
2023年10月(31)
2023年9月(30)
2023年8月(31)
2023年7月(31)
2023年6月(30)
2023年5月(31)
2023年4月(31)
2023年3月(36)
2023年2月(28)
2023年1月(26)
阅读排行榜
1. C#代码整洁之道读后总结与感想(599)
2. 选读SQL经典实例笔记01_检索和排序(369)
3. 读C#代码整洁之道笔记01_C#的编码标准和原则(311)
4. 读C#代码整洁之道笔记04_重构C#代码识别代码坏味道(309)
5. 学信息系统项目管理师第4版系列02_法律法规(268)
评论排行榜
1. 2023年1月随笔(11)
2. 2023年10月随笔之婚宴趣事多(2)
3. 读高性能MySQL(第4版)笔记12_查询性能优化(下)(2)
4. 读Java性能权威指南(第2版)笔记18_垃圾回收E(2)
推荐排行榜
1. 读高性能MySQL(第4版)笔记01_MySQL架构(上)(2)
2. 选读SQL经典实例笔记01_检索和排序(2)
3. 读软件设计的要素01概念(1)
4. 读AI未来进行式笔记01深度学习(1)
5. 读所罗门的密码笔记01_当人类遇见机器(1)
最新评论
1. Re:2023年10月随笔之婚宴趣事多
@gz4621 wondershare mindmaster...
--躺柒
2. Re:2023年10月随笔之婚宴趣事多
大神 思维导图用的什么软件制作的?
--gz4621
3. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
@东围居士 建议读新版。...
--躺柒
4. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
第4版相比第3版好像缩减了好多内容?楼主推荐第3版还是第4版
--东围居士
5. Re:读Java性能权威指南(第2版)笔记18_垃圾回收E
@屠炉 没有用第三方工具,手动的。 有几个平台直接支持markdown导入,只是要调整一下图片上传即可。...
--躺柒
点击右上角即可分享
支持DeepSeek的编程助手
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 我与微信审核的“相爱相杀”看个人小程序副业