02 2022 档案
摘要:GBDT和XGBoost的区别 GBDT是机器学习算法,XGBoost是该算法的工程实现。 在使用CART作为基分类器时,XGBoost显式地加入了正则项来控制模型的复杂度,有利于防止过拟合,从而提高模型的泛化能力。 GBDT在模型训练时只使用了代价函数的一阶导数信息,XGBoost对代价函数进行二
阅读全文
摘要:transformer bert XLnet 目前主流的nlp预训练模型包括两类 autoregressive (AR) language model 与autoencoding (AE) language model,AR模型的主要任务在于评估语料的概率分布,AR模型的缺点是单向的,我们更希望的是
阅读全文
摘要:当n很大,p很小的时候,二项分布的极限是泊松分布。 当n继续变大,为连续变量的时候,二项分布的极限又成了正态分布(正态分布是所有分布趋于极限大样本的分布)。 注意这里的λ为一段时间内的期望,如果待研究的时间段变化了,λ也要跟着变。比如医院平均每小时出生的婴儿数的参数为λ,则“医院平均每两个小时出生的
阅读全文
摘要:一、创建数组 import numpy as np import sys a=[1,3,4] b=np.array(a) # 将list转化为numpy形式 c=np.zeros((2,3)) # 创建shape=[2,3]的全0数组 d=np.ones((2,3)) # 创建shape=[2,3]
阅读全文
摘要:问题一:UnicodeEncodeError: 'ascii' codec can't encode character '\uff0c' in position 0 问题二:Python 解决 :NameError: name 'reload' is not defined 问题 对于问题一,在代
阅读全文