摘要: broadcasting是tensorflow中tensor维度扩张的最常用的手段,指对某一个维度上重复N多次,虽然它呈现数据已被扩张,但不会复制数据。 可以这样理解,对 [b,784]@[784,10]+[10]这样一个操作([10]可以理解为偏置项),那么原式可以化为[b,10]+[10],但是 阅读全文
posted @ 2020-01-20 20:17 赵代码 阅读(1031) 评论(1) 推荐(1) 编辑