会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Dababao
博客园
首页
新随笔
联系
订阅
管理
2024年10月28日
DrissionPage采集抖音搜索结果详情信息及各视频的评论详情
摘要: 目前正在做的一个项目,因为涉及到社交媒体的相关数据,在采集douyin数据的时候接触到了DrissionPage这个库,相对于该帖子发布的时间来说,该库的时效性较新,且目前在数据采集领域也属于较为新颖的方法。 DissionPage官网:🛸 概述 | DrissionPage官网 是国内大神开源的
阅读全文
posted @ 2024-10-28 17:27 Dababao
阅读(34)
评论(2)
推荐(0)
编辑
2024年4月17日
因果效应识别的理解
摘要: 潜在结果: 存在可观测结果与不可观测结果。 Yi=DiY1i+(1-Di)Y0i 因果推断的核心:想办法估计未出现观测到的反事实结果。 方法:利用同一物理个体不同时间的信息或同一时间不同物理个体的信息 稳定性假设: 一、不同个体潜在结果之间不会有交互影响 二、干预水平对所有个体都相同 事实中两个假设
阅读全文
posted @ 2024-04-17 11:27 Dababao
阅读(33)
评论(0)
推荐(0)
编辑
2024年4月12日
偏自相关与扩展样本自相关的理解
摘要: (1)偏自相关系数 cov(Zt, Zt+k|Zt+1,Zt+2,...,Zt+k-1) 若有: Zt+k=a1Zt+k-1 +a2Zt+k+2 +...+akZt +et+k (2)扩展样本自相关方法 对于ARMA模型,自相关与偏自相关都是拖尾,使用扩展样本自相关方法。 考虑ARMA模型: Zt-
阅读全文
posted @ 2024-04-12 09:40 Dababao
阅读(8)
评论(0)
推荐(0)
编辑
2024年4月8日
Lasso回归及其R语言操作
摘要: Lasso回归形式: 确定lamda使得RSS-lamda*sum(Bi)最小,RSS为普通最小二乘估计的回归平方和。 作用: 确定哪些变量更重要,lamda从0到1过程中,哪些变量的系数最慢趋于0,则这些变量相对更重要。 R语言代码: library(glmnet)set.seed(1)x=mat
阅读全文
posted @ 2024-04-08 08:30 Dababao
阅读(265)
评论(0)
推荐(0)
编辑