协变量
关于协变量:我的建议是不要在这个定义上面钻牛角尖,因为“协变量”没有唯一定义,记住什么模型下什么变量可以叫“协变量”即可。
比如,线性回归的自变量可以叫“协变量”,协变量等同于自变量。线性回归模型如果是一个方差分析模型,则“无法控制”的连续变量叫“协变量”。回归模型的分类变量可以叫“因子”,而连续变量可以叫“协变量”。中介效应分析的时候,把关注的自变量叫“自变量”,其它“自变量”叫协变量,当你接着把其它协变量当自变量的时候,开始的自变量又变成了协变量。你看,协变量的叫法根本就不唯一。
我想知道温度对于降水量的影响,但是海拔高度、经纬度、当地湿度等变量也会影响降水量。
那么,在我的研究中,温度就是自变量,降水量是因变量,而海拔高度、经纬度和当地湿度就是协变量。
举个例子,研究教学方法对学生成绩的影响,那么学生本身的成绩水平(入学成绩)就是协变量,研究时需要剔除或控制住协变量的作用,否则结果不一定可靠。
causalinference: 使用Python做因果推断
Python做因果推理
机器学习方法在很多领域都取得了巨大的成功,但大多缺乏可解释性和稳定性。因果推理是一种用于解释性分析的强大建模工具,能支持当前机器学习做出可解释且稳定的推理。
在本次报告中,我们主要围绕因果推断和因果稳定学习进行分享。面向复杂高维大数据,传统因果推断方法面临一下新挑战:(1) 高维和噪声变量,以及 (2) 连续/复杂干预变量。为了应对这些挑战,我们提出了分解表示反事实回归 (DeR-CFR) 模型和生成对抗性去混淆 (GAD) 算法。此外,通过将因果推理与机器学习相结合,我们提出了因果约束的可解释稳定学习,旨在消除复杂数据关联中的虚假关联、甄别因果关联,并利用因果关联指导机器学习,突破传统关联驱动学习的局限,实现可解释的稳定学习。
【讲座时间】
2022年3月14日 19:00
【讲座地点】
钉钉线上(扫二维码)
【讲座流程】
18:45-18:55 签到
18:55-19:00 主持人介绍嘉宾的相关背景
19:00-20:00 况琨老师:因果推断和稳定学习在商业大数据分析中的应用 Application of causal inference and stable learning in business big data analytics
20:00-20:30 陈熹老师参与互动环节
20:30-20:35 活动结束
【嘉宾简介】
况琨
浙江大学计算机学院副教授,博士生导师,人工智能系副主任。2019年获得清华大学计算机科学与技术专业博士学位,2017-2018年访问美国斯坦福大学。获2021年度中国科协青年人才托举工程项目支持,2021年度中国电子学会科学技术奖(科技进步)一等奖,2020年度中国人工智能学会优秀博士学位论文提名奖。主要研究方向包括因果推理、人工智能、因果指导的可信机器学习,关注机器学习的可解释性、稳定性、公平性和可回溯性。在数据挖掘和机器学习领域已发表近40余篇顶级会议和期刊文章,包括KDD、ICML、MM、AAAI、TKDE、TKDD、Engineering等。
【讲座简介】
机器学习方法在很多领域都取得了巨大的成功,但大多缺乏可解释性和稳定性。因果推理是一种用于解释性分析的强大建模工具,能支持当前机器学习做出可解释且稳定的推理。
在本次报告中,我们主要围绕因果推断和因果稳定学习进行分享。面向复杂高维大数据,传统因果推断方法面临一下新挑战:(1) 高维和噪声变量,以及 (2) 连续/复杂干预变量。为了应对这些挑战,我们提出了分解表示反事实回归 (DeR-CFR) 模型和生成对抗性去混淆 (GAD) 算法。此外,通过将因果推理与机器学习相结合,我们提出了因果约束的可解释稳定学习,旨在消除复杂数据关联中的虚假关联、甄别因果关联,并利用因果关联指导机器学习,突破传统关联驱动学习的局限,实现可解释的稳定学习。