摘要: transformer bert XLnet 目前主流的nlp预训练模型包括两类 autoregressive (AR) language model 与autoencoding (AE) language model,AR模型的主要任务在于评估语料的概率分布,AR模型的缺点是单向的,我们更希望的是 阅读全文
posted @ 2022-02-08 19:34 suwenyuan 阅读(427) 评论(0) 推荐(0) 编辑
摘要: 当n很大,p很小的时候,二项分布的极限是泊松分布。 当n继续变大,为连续变量的时候,二项分布的极限又成了正态分布(正态分布是所有分布趋于极限大样本的分布)。 注意这里的λ为一段时间内的期望,如果待研究的时间段变化了,λ也要跟着变。比如医院平均每小时出生的婴儿数的参数为λ,则“医院平均每两个小时出生的 阅读全文
posted @ 2022-02-08 14:44 suwenyuan 阅读(430) 评论(0) 推荐(0) 编辑