2024年10月28日
摘要: 目前正在做的一个项目,因为涉及到社交媒体的相关数据,在采集douyin数据的时候接触到了DrissionPage这个库,相对于该帖子发布的时间来说,该库的时效性较新,且目前在数据采集领域也属于较为新颖的方法。 DissionPage官网:🛸 概述 | DrissionPage官网 是国内大神开源的 阅读全文
posted @ 2024-10-28 17:27 Dababao 阅读(34) 评论(2) 推荐(0) 编辑
  2024年4月17日
摘要: 潜在结果: 存在可观测结果与不可观测结果。 Yi=DiY1i+(1-Di)Y0i 因果推断的核心:想办法估计未出现观测到的反事实结果。 方法:利用同一物理个体不同时间的信息或同一时间不同物理个体的信息 稳定性假设: 一、不同个体潜在结果之间不会有交互影响 二、干预水平对所有个体都相同 事实中两个假设 阅读全文
posted @ 2024-04-17 11:27 Dababao 阅读(33) 评论(0) 推荐(0) 编辑
  2024年4月12日
摘要: (1)偏自相关系数 cov(Zt, Zt+k|Zt+1,Zt+2,...,Zt+k-1) 若有: Zt+k=a1Zt+k-1 +a2Zt+k+2 +...+akZt +et+k (2)扩展样本自相关方法 对于ARMA模型,自相关与偏自相关都是拖尾,使用扩展样本自相关方法。 考虑ARMA模型: Zt- 阅读全文
posted @ 2024-04-12 09:40 Dababao 阅读(8) 评论(0) 推荐(0) 编辑
  2024年4月8日
摘要: Lasso回归形式: 确定lamda使得RSS-lamda*sum(Bi)最小,RSS为普通最小二乘估计的回归平方和。 作用: 确定哪些变量更重要,lamda从0到1过程中,哪些变量的系数最慢趋于0,则这些变量相对更重要。 R语言代码: library(glmnet)set.seed(1)x=mat 阅读全文
posted @ 2024-04-08 08:30 Dababao 阅读(265) 评论(0) 推荐(0) 编辑