摘要:
分类的常用指标有: accuracy:准确率 recall:召回率 precison:精确率 f1score:f1分数,是recall和precison的调和均值。 准确率什么情况下失效? 在正负样本不均衡的情况下,accuracy这个指标有很大的缺陷。 如:正样本990个,负样本10个。 这样好像 阅读全文
摘要:
可解释性 (Interpretation) 可解释性的问题较早就有人提出来,有着不一样的叫法,比如 interpretable, explainable, intelligible, transparent 和 understandable,不一而足。 值得提到的是此处的可解释性与推荐系统的推荐理由 阅读全文
摘要:
TensorFlow支持广播机制(Broadcast) TensorFlow支持广播机制(Broadcast),可以广播元素间操作(elementwise operations)。正常情况下,当你想要进行一些操作如加法,乘法时,你需要确保操作数的形状是相匹配的,如:你不能将一个具有形状[3, 2]的 阅读全文
摘要:
维度灾难带来的问题 由上面我们明白了,有了更好的区分样本类别,我们需要增加特征值个数,从而引来维度灾难问题,那么维度灾难有什么后果呢? 增加了特征值得个数,从而造成了需要填充特征值空间的样本数据以指数形式增长,这对于收集样本数据来说是个恐怖的事情,试想下如果每个维度有100个值对应,那么需要填充5个 阅读全文
摘要:
Python的版本主要分为 2.× 、 3.× 两个系列。 Python3计划每年发布一个新的子版本,一次只增加一两种新语法。 使用时当然选择越新的Python版本越好,版本越老的代码越难维护。 维护老版本的代码时,需要了解各版本之间的主要差异。有时看到一些代码的语法特点,可以大致猜出它是什么版本。 阅读全文