11 2023 档案

Kaggle:Titanc Survived
摘要:Kaggle:Titanc Survived 数据处理 对于这个问题,在训练集中给了10列作为特征。其中有一些对结果预测并没有太大影响的PassengerId、Name、Cabin、Ticket。 PassengerId可以直接作为pandas读取cvs文件时候的index_col。 train_d
13
0
0
Kaggle:Otto Group Classification
摘要:Kaggle:Otto Group ClassificationKaggle:Otto Group Classification 数据处理 导入相应的包之后,从csv文件中读取数据,指定id列为index列。本身id列也不携带预测信息。同时将训练数据和测试数据拼接在一起。 train_data = pd.read_csv("dataset/train.csv",
44
0
0
Kaggle:House Prices
摘要:Kaggle:House PricesKaggle:House Prices 数据处理 首先是处理数据,导入相应的包,使用pandas读取csv文件,并指定Id列为index,本身Id这一列也不携带预测信息。同时将训练数据和测试数据拼接在一起以便后续的处理。 train_data = pd.read_csv("dataset/train
16
0
0
c5w3_序列模型和注意力机制
摘要:序列模型和注意力机制 Seq2Seq模型 Seq2Seq(Sequence-to-Sequence)模型能够应用与机器翻译、语音识别等各种序列到序列的转换问题。一个Seq2Seq模型包括编码器(Encoder)和解码器(Decoder)两部分,它们通常是两个不同的RNN。如下图所示,将编码器的输出作
17
0
0
c5w2_自然语言处理与词嵌入
摘要:自然语言处理与词嵌入 词嵌入 one-hot向量表示了每个词在词汇表中的位置,但是每个one-hot向量的内积为0,不能表示出每个词之间的相互关系。 I want a glass of orange juice. I want a glass of apple __. 例如,对于上述的这样一句话,通
57
0
0
c5w1_循环序列模型
摘要:循环序列模型 自然语言和音频都是前后相关联的数据,对于这些前后相关联的序列数据通过循环神经网络(Recurrent Neural Network, RNN)来进行处理。 使用RNN收i先的应用有下图所示的例子: 上图中所有的这些问题都可以通过有监督学习,通过输入给定的标签数据X,Y作为训
26
0
0
c4w4_人脸识别和神经风格转换
摘要:特殊应用:人脸识别和神经风格转换 人脸识别 与人脸识别(Face Recognition)相关的还有活体检测(Liveness Detection)问题,在这里仅讨论前者。 人脸验证(Face Verification)和人脸识别(Face Recognition)的区别: 人脸验证:一般指一个1对
35
0
0
c4w3_目标检测
摘要:目标检测 Object detection 目标检测的第一步是目标定位(Object localization)。对于图片分类器我们已经十分了解,而目标定位不仅需要判断图片中是否有某一类对象,还需要在图片中标记出它的位置。 如果图片中有多个对象,就需要识别出图片中所有的对象,并标记出来位置,也就是目
18
0
0
c4w2_深度卷积网络案例探究
摘要:深度卷积模型:案例探究 为什么要学习一些案例呢? 就像通过看别人的代码来学习编程一样,通过学习卷积神经模型的案例,建立对卷积神经网络的(CNN)的“直觉”。并且可以把从案例中学习到的思想、模型移植到另外的任务上去,他们往往也表现得很好。 接下来要学习的神经网络: 经典模型:LeNet5、AlexNe
28
0
0
c4w1_卷积神经网络
摘要:卷积神经网络 计算机视觉问题 计算机视觉(computer vision)是因深度学习而快速发展的领域之一,它存进了如自动驾驶、人脸识别等应用的发展,同时计算机视觉领域的发展还可以给其他领域提供思路。 计算机视觉应用的实例:图片分类(识别是不是一只猫)、目标检测(检测途中汽车行人等)、图片风格转移等
22
0
0
c3w2_机器学习(ML)策略2
摘要:误差分析 Error Analysis 如果你的机器学习算法表现得还不够好,那么通过手工去检查算法所犯的错误,这个过程称为错误分析(Error Analysis)。 举例如下,团队开发的识别猫咪的分类器,在dev set上准确率为90%。此时我们希望提升算法的性能,通过分析算法的错误样本,发现其中有
87
0
0
c3w1_机器学习(ML)策略1
摘要:Introduction to ML strategy 为什么要选用机器学习策略? 比如下面这个识别猫的分类器,目前的训练结果可能达到了90%的准确率。但是如果像进一步提高性能,有很多待选的方法。但是该如何去选择呢? 下面的课程就是主要介绍Machine Learning Strategy。需要注意
35
0
0
c2w2_优化算法
摘要:优化算法 机器学习是一个高度依赖经验的过程,需要在成千上万的数据上迭代多次来得到最小化损失函数的目的。所以对于如此大规模的数据,需要通过对算法进行优化来提高训练模型的效率。 mini-batch梯度下降法 此前,我们通过向量化,一次迭代就可以在所有的训练样本上进行梯度下降的运算,对此我们称之为bat
159
0
0
c2w1_深度学习的实用层面
摘要:深度学习的实用层面 数据集:Train/Dev/Test sets 深度学习是一个典型的高度迭代的过程,需要不断地进行循环测试,来找到最适合当前网络的超参。一方面可以提升迭代的效率,另一方面可以避免过度拟合等问题。 在实践中,(合理的)高质量训练集、验证集和测试集,有助于提升迭代的效率。 Train
10
0
0
c1w4_深层神经网络
摘要:深层神经网络 什么是深层神经网络? 深层的神经网络(Deep L-layer neural network)就是包含了更多隐藏层的神经网络。 从某种意义上来说,logistic regression可以称为一层的神经网络“1 layer NN”。当计算神经网络的层数,通常将输出层计算在内,而输出层不
25
0
0
点击右上角即可分享
微信分享提示
深色
回顶
收起