摘要: 性质 判别模型 分类模型 模型 \[ P(Y=1|x) = \frac{e^{w \cdot x}}{1+e^{w \cdot x}}\\ P(Y=0|x)=\frac{1}{1+e^{w \cdot x}} \] 损失函数 最大似然估计 \[ \begin{aligned} L(w) & = \p 阅读全文
posted @ 2020-08-01 00:30 YoungF 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 参数估计(Parameter Estimate)就是通过一系列算法,来求出模型的最优参数。在各个机器学习深度学习的框架里,都变成了optimizer的活了。 其实这个名字很奇怪,但是在比较早的机器学习论文里都是这么叫的,我们重点来关注下里面涉及的一些算法。 这里主要关注的是 最小二乘法 梯度下降 牛 阅读全文
posted @ 2020-08-01 00:29 YoungF 阅读(813) 评论(0) 推荐(0) 编辑
摘要: 注意力的种类有如下四种: 加法注意力, Bahdanau Attention 点乘注意力, Luong Attention 自注意力, Self-Attention 多头点乘注意力, Multi-Head Dot Product Attention(请转至Transformer模型) 1. Bahd 阅读全文
posted @ 2020-08-01 00:27 YoungF 阅读(1987) 评论(0) 推荐(0) 编辑
摘要: 01 《清平调·云想衣裳花想容》 李白 云想衣裳花想容, 春风拂槛露华浓。 若非群玉山头见, 会向瑶台月下逢。 02 《离思五首·其四》 元稹 曾经沧海难为水,除却巫山不是云。 取次花丛懒回顾,半缘修道半缘君。 03 叶底藏花一度,梦里踏雪几回。 ——《一代宗师》 04 伊人何在,总在寒冷清秋! — 阅读全文
posted @ 2020-08-01 00:23 YoungF 阅读(266) 评论(0) 推荐(0) 编辑
摘要: Text preprocessing is an essential part of NLP tasks. Conversion from Complicated Chinese to Simple Chinese The code below has a dependency on two pyt 阅读全文
posted @ 2020-08-01 00:17 YoungF 阅读(186) 评论(0) 推荐(0) 编辑