会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
躺柒
博客园
首页
新随笔
联系
订阅
管理
随笔 - 788
文章 - 0
评论 - 17
阅读 -
49126
读算法霸权笔记04_排名模型
排名算法
合集 - 读算法霸权(13)
1.
读算法霸权笔记
13_读后总结与感想兼导读
2024-01-10
2.
读算法霸权笔记
01_数学杀伤性武器
2023-12-23
3.
读算法霸权笔记
02_盲点炸弹
2023-12-24
4.
读算法霸权笔记
03_操控与恐吓
2023-12-25
5.
读算法霸权笔记
04_排名模型
2023-12-27
6.
读算法霸权笔记
05_掠夺式广告
2023-12-28
7.
读算法霸权笔记
06_犯罪预测
2023-12-29
8.
读算法霸权笔记
07_筛选
2023-12-30
9.
读算法霸权笔记
08_反馈
2023-12-31
10.
读算法霸权笔记
09_信用数据的陷阱
2024-01-02
11.
读算法霸权笔记
10_分类与群体
2024-01-04
12.
读算法霸权笔记
11_微目标
2024-01-05
13.
读算法霸权笔记
12_数据科学
2024-01-06
1. 模型算法
1.1. 一种模型算法,不管是饮食方面的还是税法方面的,其在理论上也许是无害的
1.2. 如果将该模型算法推行为全美或者全球标准,其结果就是产生一个扭曲的、极为糟糕的经济体系
1.3. 规模化是主要的原因
2. 排名模型
2.1. 优秀大学
2.1.1. 新生SAT成绩都很高,而且绝大部分都能顺利毕业
2.1.2. 已毕业的校友都很有钱,会不断给学校捐款
2.2. 杂志《美国新闻》
2.2.1. 1983年
2.2.1.1. 评估全美1800所学院和大学,按优秀度为这些学校做一个排名
2.2.2. 《美国新闻》的编辑所做的是“教育优秀度”排名
2.2.2.1. 比粮食成本或者每个麦粒的蛋白质含量更加抽象、模糊的价值
2.2.2.2. 编辑只是挑选了一些和评估目标看似相关的变量
2.2.2.2.1. 模型建立的依据仅仅是人们凭空想象什么是对教育而言最重要的因素
2.2.2.2.2. 这些人便去寻找可以测量的相关变量,最后随意地在公式中赋予每个变量一定的权重,这样模型就完成了
2.2.2.3. 杂志社拿不到与大学教育优秀度最相关的数据,即每个学校学生的学习内容
2.2.2.4. 基于替代变量建立的《美国新闻》大学排名模型也足够反映问题了
2.2.3. 如果该项目组将教育成本纳入算法,则其模型输出也许会发生奇怪的变化
2.2.3.1. 学费便宜的大学很可能因此闯入优秀大学之列,而这一结果将遭到广泛的质疑
2.2.3.2. 《美国新闻》的排名模型把成本排除在算法外
2.2.4. 犯下的更大的错误来自他们没有纳入考虑的变量:学杂费、学生助学金
2.3. 替代变量
2.3.1. 当你基于替代变量建立模型时,钻模型的漏洞会变得容易很多
2.3.1.1. 因为替代变量比起其所代表的复杂事实更容易操控
2.3.2. 当推特粉丝数是获得该公司职位的关键这一消息遭到泄露时会发生什么
2.3.2.1. 应聘者很快就会无所不用其极地增加推特粉丝
2.3.2.2. 有人会花费19.95美元直接“购买”大量由机器操控的粉丝
2.3.2.3. 因为人们钻了招聘系统的漏洞,替代变量失去了效力
2.4. 关键问题就是排名会自行巩固
2.4.1. 排名决定了大学的命运
2.4.1.1. 大学的整体声誉生态系统被一组数字蒙上了阴影
2.4.2. 如果一所大学在《美国新闻》所发布的排名中名次靠后,它的声誉就会下降,生源情况就会恶化
2.4.3. 许多学校最焦虑的是那不能控制的占排名结果1/4权重的因素,即声誉分数,来自各个大学、学院的校领导给出的问卷调查反馈
2.4.3.1. 声誉是模型中权重最大的变量
2.4.4. 位居排名前列的知名学府往往也会得到一致好评,因为人们熟知这些学校
2.4.5. 对于还未被人熟知、渴望占据一席之地的学校而言,提升排名则变得更难了
2.4.6. 各个大学只能选择配合,他们不得不努力提高排名所涉及的每一个考核项的分数
2.4.7. 即使是各指标分数均有所提升的学校在排名中也会落后于其他分数提升得更快的学校
2.4.7.1. 一场学校间的军备竞赛
2.4.8. 赢得体育比赛是吸引学生申请某所大学的关键因素
2.4.9. 学校拒绝的申请学生越多,其录取率就越低,对排名就越有利
2.4.9.1. 让学生感到沮丧的是,所谓的保底学校也不再是一个安全牌
2.4.9.2. 以前的保底学校现在可能不得不设置助学金才能吸引那些优秀的学生
2.4.9.2.1. 这对那些最需要助学金的学生来说,则意味着其学费负担更重了
2.4.9.3. 大学遭受了重大损失,顶尖学生大量流失
2.4.10. 排名模型有力地刺激了各方在教育上的不断投资,而飙升的学费则被忽视了
2.4.11. 排名自然而然地成为一个不断自我巩固、自我发展的特权
2.4.11.1. 排名延伸到了医学院、牙科学校、文学和工学研究生院,甚至高中
2.5. 问题不是出在《美国新闻》排名模型本身上,而是出在该模型的规模上
2.5.1. 《美国新闻》的大学排名模型规模巨大,造成了大范围的损害,导致了几乎是无尽的恶性循环
2.5.2. 该模型迫使每个人、每个学校都认准同一个目标,这导致了激烈竞争,以及很多意料之外的有害后果
2.6. 在一个作弊成风的制度下,遵守规定反倒成了不利条件
2.6.1. 兰斯·阿姆斯特朗和他的队友靠着兴奋剂连续7年打败了环法自行车比赛中的其他选手,那些同样遵守规定的选手想必对此感同身受
2.6.2. 唯一的胜出方式就是牢牢掌握某个优势,同时确保其他人的优势不比你的更大
3. 美国大学
3.1. 如果你站在大学校长的角度思考这件事情,你会发现大学排名其实是很糟糕的
3.1.1. 正处在事业高峰期的校长需要投入巨大的精力提高与学校教育优秀度有关的15个考核项的分数
3.1.2. 这15个考核项是由一个二流杂志社的一组编辑定义的
3.1.2.1. 降低成本则不在其列
3.1.2.2. 提高学费反而能让他们有更多的资源用于提升考核项目的表现
3.1.3. 他们正是掉进了死板模型,即数学杀伤性武器的陷阱之中
3.2. 有些名校,包括宾夕法尼亚州的巴克内尔大学和加利福尼亚州的麦肯纳学院,则给《美国新闻》反馈了假数据,夸大了其学校新生的入学分数
3.3. 更多的校领导则试图寻找一种更常规的方式来提高他们的学校排名
3.3.1. 他们没有作弊,而是努力提升学校在影响最终分数的每一个变量上的表现
3.3.2. 他们可能会认为这是效率最高的资源利用方式
3.4. 随着排名产业的发展,钻模型漏洞的手段也越发丰富
3.4.1. 2014年的《美国新闻》全球大学排名中,沙特阿拉伯的阿卜杜勒阿齐兹国王大学(KAU)的数学系排名第7,仅次于哈佛
3.4.2. 该校的数学系仅成立了两年,没人知道它是如何一下子跃升至全球前10,甚至超过了剑桥大学和麻省理工学院的数学系的
3.5. 算法本身也有能被钻空子的漏洞
3.6. 教育公司的专业人士了解每个学校的招生模型,所以他们知道怎样让一个准大学生被纳入其目标学校的“投资组合”之中
3.6.1. 招生模型让学生和家长身陷焦虑,花掉大把的钱
3.6.2. 招生模型都是不透明的,大多数的申请学生(或者叫受害学生)都被蒙在鼓里
3.6.3. 在各个大学的人脉以获取第一手信息或者逆向推导各个学校的招生模型算法,教育公司的专业人士破解了绝大部分学校的招生模型
3.7. 大学招生制度只对少数人而言是有利可图的,且根本没有任何教育价值,只不过是以某种新奇的方式将一群18岁的孩子重新排序分类
3.7.1. 所有这些学生,不管是来自富人阶级还是来自工人阶级,都被培训成要去适应一台巨大的机器,一个被大规模投入使用的数学杀伤性武器
3.8. 主要受害者仍然是美国的大多数,即穷人和中产阶层
3.8.1. 他们没有那么多钱可以花在课程和咨询公司上
3.8.2. 他们错失了珍贵的内部信息
3.8.3. 教育体系偏向于特权阶层,偏离于穷人和中产阶层
3.8.3.1. 淘汰后一类家庭出身的绝大多数学生,将他们推向贫穷之路,进一步加剧了社会阶层固化
3.9. 提高毕业率很简单,只需降低毕业要求就可以了
3.10. 提高毕业生的收入水平也很容易办到
3.10.1. 所有大学要做的就是减少文科专业,撤掉教育系和社会服务系,因为教师和社会工作者挣的钱没有工程师、化学家和计算机科学家多
3.10.1.1. 虽然前者对社会而言必不可少
3.11. 降低学校成本也不是太难
3.11.1. 一个已经广泛流行的方法就是降低终身教授在学校教职工中所占的比例,在他们退休后聘请成本较低的讲师或者兼职教授
3.11.2. 忙碌的兼职教授可能为了交房租在三所大学教五门课程,几乎不可能有时间或者精力为学生提供更好的教育
3.11.3. 还有一个办法是撤掉一些不必要的行政职务,但这种做法似乎太罕见了
3.12. 教育部没有将大学重新排名,而是把大量的调查数据公布在网站上
3.12.1. 每一个人可以自行制定个人的模型
3.12.2. 透明,用户控制,个人化
3.12.2.1. 完全是数学杀伤性武器的对立面
合集:
读算法霸权
好文要顶
关注我
收藏该文
微信分享
躺柒
粉丝 -
50
关注 -
0
+加关注
0
0
升级成为会员
«
上一篇:
读程序员的README笔记19_读后总结与感想兼导读
»
下一篇:
读算法霸权笔记05_掠夺式广告
posted @
2023-12-27 06:51
躺柒
阅读(
42
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
登录后才能查看或发表评论,立即
登录
或者
逛逛
博客园首页
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
相关博文:
·
读算法霸权笔记12_数据科学
·
读算法霸权笔记05_掠夺式广告
·
MIT-6-S897-医疗机器学习-2019-中文笔记-一-
·
玩玩luogu算法题——第1期
·
金融投资中的概率机器学习-全-
阅读排行:
·
【.NET】调用本地 Deepseek 模型
·
CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
·
DeepSeek “源神”启动!「GitHub 热点速览」
·
Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
·
我与微信审核的“相爱相杀”看个人小程序副业
公告
昵称:
躺柒
园龄:
2年1个月
粉丝:
50
关注:
0
+加关注
<
2025年2月
>
日
一
二
三
四
五
六
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
合集
学信息系统项目管理师第4版(35)
学系统集成项目管理工程师(中项)(43)
读高性能MySQL(第4版)(21)
读发布!设计与部署稳定的分布式系统(第2版)(34)
随笔及总结(26)
读改变未来的九大算法(10)
读数据压缩入门(11)
读C#代码整洁之道(8)
读编程与类型系统(12)
读函数式编程思维(6)
读Java8函数式编程(9)
读Java实战(第二版)(20)
读Java性能权威指南(第2版)(31)
读SQL进阶教程(17)
选读SQL经典实例(23)
读SQL学习指南(第3版)(13)
读图数据库实战(11)
读程序员的制胜技(15)
读像火箭科学家一样思考(16)
读程序员的README(19)
读算法霸权(13)
读元宇宙改变一切(14)
读AI3.0(10)
读千脑智能(13)
读十堂极简人工智能课(9)
读人工不智能:计算机如何误解世界(10)
读算法的陷阱:超级平台、算法垄断与场景欺骗(20)
读所罗门的密码(21)
读天才与算法:人脑与AI的数学思维(26)
读人工智能时代与人类未来(19)
读AI未来进行式(12)
读AI新生:破解人机共存密码(18)
读人工智能全传(16)
读写给大家的AI极简史(7)
读零信任网络:在不可信网络中构建安全系统(21)
读软件开发安全之道:概念、设计与实施(17)
读软件设计的要素(7)
读构建可扩展分布式系统:方法与实践(16)
读数据湖仓(9)
读数据工程之道:设计和构建健壮的数据系统(34)
读数据质量管理:数据可靠性与数据质量问题解决之道(20)
读数据保护:工作负载的可恢复性(31)
读量子霸权(18)
读算法简史:从美索不达米亚到人工智能时代(15)
读当我点击时,算法在想什么?(7)
读DAMA数据管理知识体系指南(4)
更多
随笔档案
2025年2月(25)
2025年1月(31)
2024年12月(31)
2024年11月(30)
2024年10月(31)
2024年9月(30)
2024年8月(31)
2024年7月(31)
2024年6月(30)
2024年5月(31)
2024年4月(30)
2024年3月(31)
2024年2月(29)
2024年1月(31)
2023年12月(31)
2023年11月(30)
2023年10月(31)
2023年9月(30)
2023年8月(31)
2023年7月(31)
2023年6月(30)
2023年5月(31)
2023年4月(31)
2023年3月(36)
2023年2月(28)
2023年1月(26)
阅读排行榜
1. C#代码整洁之道读后总结与感想(599)
2. 选读SQL经典实例笔记01_检索和排序(369)
3. 读C#代码整洁之道笔记01_C#的编码标准和原则(311)
4. 读C#代码整洁之道笔记04_重构C#代码识别代码坏味道(309)
5. 学信息系统项目管理师第4版系列02_法律法规(268)
评论排行榜
1. 2023年1月随笔(11)
2. 2023年10月随笔之婚宴趣事多(2)
3. 读高性能MySQL(第4版)笔记12_查询性能优化(下)(2)
4. 读Java性能权威指南(第2版)笔记18_垃圾回收E(2)
推荐排行榜
1. 读高性能MySQL(第4版)笔记01_MySQL架构(上)(2)
2. 选读SQL经典实例笔记01_检索和排序(2)
3. 读软件设计的要素01概念(1)
4. 读AI未来进行式笔记01深度学习(1)
5. 读所罗门的密码笔记01_当人类遇见机器(1)
最新评论
1. Re:2023年10月随笔之婚宴趣事多
@gz4621 wondershare mindmaster...
--躺柒
2. Re:2023年10月随笔之婚宴趣事多
大神 思维导图用的什么软件制作的?
--gz4621
3. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
@东围居士 建议读新版。...
--躺柒
4. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
第4版相比第3版好像缩减了好多内容?楼主推荐第3版还是第4版
--东围居士
5. Re:读Java性能权威指南(第2版)笔记18_垃圾回收E
@屠炉 没有用第三方工具,手动的。 有几个平台直接支持markdown导入,只是要调整一下图片上传即可。...
--躺柒
点击右上角即可分享
支持DeepSeek的编程助手
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 我与微信审核的“相爱相杀”看个人小程序副业