2023 年 11月随笔档案 - newbe3three

Kaggle:Titanc Survived

摘要：Kaggle:Titanc Survived 数据处理对于这个问题，在训练集中给了10列作为特征。其中有一些对结果预测并没有太大影响的PassengerId、Name、Cabin、Ticket。 PassengerId可以直接作为pandas读取cvs文件时候的index_col。 train_d

13

0

Kaggle:Otto Group Classification

摘要：

Kaggle:Otto Group Classification 数据处理导入相应的包之后，从csv文件中读取数据，指定id列为index列。本身id列也不携带预测信息。同时将训练数据和测试数据拼接在一起。 train_data = pd.read_csv("dataset/train.csv",

44

0

Kaggle:House Prices

摘要：

Kaggle:House Prices 数据处理首先是处理数据，导入相应的包，使用pandas读取csv文件，并指定Id列为index，本身Id这一列也不携带预测信息。同时将训练数据和测试数据拼接在一起以便后续的处理。 train_data = pd.read_csv("dataset/train

16

0

c5w3_序列模型和注意力机制

摘要：序列模型和注意力机制 Seq2Seq模型 Seq2Seq（Sequence-to-Sequence）模型能够应用与机器翻译、语音识别等各种序列到序列的转换问题。一个Seq2Seq模型包括编码器（Encoder）和解码器（Decoder）两部分，它们通常是两个不同的RNN。如下图所示，将编码器的输出作

17

0

c5w2_自然语言处理与词嵌入

摘要：自然语言处理与词嵌入词嵌入 one-hot向量表示了每个词在词汇表中的位置，但是每个one-hot向量的内积为0，不能表示出每个词之间的相互关系。 I want a glass of orange juice. I want a glass of apple __. 例如，对于上述的这样一句话，通

57

0

c5w1_循环序列模型

摘要：循环序列模型自然语言和音频都是前后相关联的数据，对于这些前后相关联的序列数据通过循环神经网络（Recurrent Neural Network, RNN）来进行处理。使用RNN收i先的应用有下图所示的例子：上图中所有的这些问题都可以通过有监督学习，通过输入给定的标签数据

（ X, Y ）

$（X,Y）$ 作为训

26

0

c4w4_人脸识别和神经风格转换

摘要：特殊应用：人脸识别和神经风格转换人脸识别与人脸识别（Face Recognition）相关的还有活体检测（Liveness Detection）问题，在这里仅讨论前者。人脸验证（Face Verification）和人脸识别（Face Recognition）的区别: 人脸验证：一般指一个1对

35

0

c4w3_目标检测

摘要：目标检测 Object detection 目标检测的第一步是目标定位（Object localization）。对于图片分类器我们已经十分了解，而目标定位不仅需要判断图片中是否有某一类对象，还需要在图片中标记出它的位置。如果图片中有多个对象，就需要识别出图片中所有的对象，并标记出来位置，也就是目

18

0

c4w2_深度卷积网络案例探究

摘要：深度卷积模型：案例探究为什么要学习一些案例呢？就像通过看别人的代码来学习编程一样，通过学习卷积神经模型的案例，建立对卷积神经网络的（CNN）的“直觉”。并且可以把从案例中学习到的思想、模型移植到另外的任务上去，他们往往也表现得很好。接下来要学习的神经网络：经典模型：LeNet5、AlexNe

28

0

c4w1_卷积神经网络

摘要：卷积神经网络计算机视觉问题计算机视觉（computer vision）是因深度学习而快速发展的领域之一，它存进了如自动驾驶、人脸识别等应用的发展，同时计算机视觉领域的发展还可以给其他领域提供思路。计算机视觉应用的实例：图片分类（识别是不是一只猫）、目标检测（检测途中汽车行人等）、图片风格转移等

22

0

c3w2_机器学习（ML）策略2

摘要：误差分析 Error Analysis 如果你的机器学习算法表现得还不够好，那么通过手工去检查算法所犯的错误，这个过程称为错误分析（Error Analysis）。举例如下，团队开发的识别猫咪的分类器，在dev set上准确率为90%。此时我们希望提升算法的性能，通过分析算法的错误样本，发现其中有

87

0

c3w1_机器学习（ML）策略1

摘要：Introduction to ML strategy 为什么要选用机器学习策略？比如下面这个识别猫的分类器，目前的训练结果可能达到了90%的准确率。但是如果像进一步提高性能，有很多待选的方法。但是该如何去选择呢？下面的课程就是主要介绍Machine Learning Strategy。需要注意

35

0

c2w2_优化算法

摘要：优化算法机器学习是一个高度依赖经验的过程，需要在成千上万的数据上迭代多次来得到最小化损失函数的目的。所以对于如此大规模的数据，需要通过对算法进行优化来提高训练模型的效率。 mini-batch梯度下降法此前，我们通过向量化，一次迭代就可以在所有的训练样本上进行梯度下降的运算，对此我们称之为bat

159

0

c2w1_深度学习的实用层面

摘要：深度学习的实用层面数据集：Train/Dev/Test sets 深度学习是一个典型的高度迭代的过程，需要不断地进行循环测试，来找到最适合当前网络的超参。一方面可以提升迭代的效率，另一方面可以避免过度拟合等问题。在实践中，（合理的）高质量训练集、验证集和测试集，有助于提升迭代的效率。 Train

10

0

c1w4_深层神经网络

摘要：深层神经网络什么是深层神经网络？深层的神经网络（Deep L-layer neural network）就是包含了更多隐藏层的神经网络。从某种意义上来说，logistic regression可以称为一层的神经网络“1 layer NN”。当计算神经网络的层数，通常将输出层计算在内，而输出层不

25

0

newbe3three

11 2023 档案

公告

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (24)

随笔档案 (26)

阅读排行榜

评论排行榜

推荐排行榜

最新评论