02 2022 档案

摘要:GBDT和XGBoost的区别 GBDT是机器学习算法,XGBoost是该算法的工程实现。 在使用CART作为基分类器时,XGBoost显式地加入了正则项来控制模型的复杂度,有利于防止过拟合,从而提高模型的泛化能力。 GBDT在模型训练时只使用了代价函数的一阶导数信息,XGBoost对代价函数进行二 阅读全文
posted @ 2022-02-24 11:56 suwenyuan 阅读(65) 评论(0) 推荐(0) 编辑
摘要:transformer bert XLnet 目前主流的nlp预训练模型包括两类 autoregressive (AR) language model 与autoencoding (AE) language model,AR模型的主要任务在于评估语料的概率分布,AR模型的缺点是单向的,我们更希望的是 阅读全文
posted @ 2022-02-08 19:34 suwenyuan 阅读(528) 评论(0) 推荐(0) 编辑
摘要:当n很大,p很小的时候,二项分布的极限是泊松分布。 当n继续变大,为连续变量的时候,二项分布的极限又成了正态分布(正态分布是所有分布趋于极限大样本的分布)。 注意这里的λ为一段时间内的期望,如果待研究的时间段变化了,λ也要跟着变。比如医院平均每小时出生的婴儿数的参数为λ,则“医院平均每两个小时出生的 阅读全文
posted @ 2022-02-08 14:44 suwenyuan 阅读(593) 评论(0) 推荐(0) 编辑
摘要:一、创建数组 import numpy as np import sys a=[1,3,4] b=np.array(a) # 将list转化为numpy形式 c=np.zeros((2,3)) # 创建shape=[2,3]的全0数组 d=np.ones((2,3)) # 创建shape=[2,3] 阅读全文
posted @ 2022-02-04 18:38 suwenyuan 阅读(67) 评论(0) 推荐(0) 编辑
摘要:问题一:UnicodeEncodeError: 'ascii' codec can't encode character '\uff0c' in position 0 问题二:Python 解决 :NameError: name 'reload' is not defined 问题 对于问题一,在代 阅读全文
posted @ 2022-02-02 16:40 suwenyuan 阅读(46) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示