04 2024 档案

摘要:目录1. 概念2. BiLSTM + CRF 结构3. CRF建模的损失函数4. 全部路径的分数计算--前向算法的动态规划5. CRF的Viterbi解码 参考链接: https://paddlepedia.readthedocs.io/en/latest/tutorials/natural_lan 阅读全文
posted @ 2024-04-28 23:30 jack-chen666 阅读(165) 评论(0) 推荐(0) 编辑
摘要:目录1. 训练2. 推理3. 效果 1. 训练 import collections import numpy as np import tensorflow as tf # 数据预处理 # poetry_file = './data/poetry.txt' # 诗集 poetrys = [] wi 阅读全文
posted @ 2024-04-21 22:32 jack-chen666 阅读(59) 评论(0) 推荐(0) 编辑
摘要:目录1. 数据的获取2. 数据加载3. 制作数据集4. 制作训练集5. 模型定义6. 训练模型7. 可视化8. 结果 1. 数据的获取 # 导入一些需要的库 # 由于Python是由社区推动的开源并且免费的开发语言,不受商业公司控制,因此,Python的改进往往比较激进, # 不兼容的情况时有发生。 阅读全文
posted @ 2024-04-21 22:21 jack-chen666 阅读(34) 评论(0) 推荐(0) 编辑
摘要:GPT 代码与论文 https://github.com/lyeoni/gpt-pytorch https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf Bert算法的论 阅读全文
posted @ 2024-04-16 11:53 jack-chen666 阅读(32) 评论(0) 推荐(0) 编辑
摘要:目录1. 最基本的单层网络2. N VS 13. 1 VS N4. N vs M5. Attention机制 参考链接:完全图解RNN、RNN变体、Seq2Seq、Attention机制 1. 最基本的单层网络 输入是x,经过变换Wx+b和激活函数f得到输出y。 经典的RNN结构(N vs N) 序 阅读全文
posted @ 2024-04-15 15:57 jack-chen666 阅读(9) 评论(0) 推荐(0) 编辑
摘要:目录1. sequence2sequence任务 特点2. 编码器与解码器3. Attention 注意力机制--太重要了!!4. 自注意力机制 参考:https://zhuanlan.zhihu.com/p/38816145 sequence2sequence模型发展到今天,根据不同任务有着不同的 阅读全文
posted @ 2024-04-12 20:26 jack-chen666 阅读(60) 评论(0) 推荐(0) 编辑
摘要:目录1. 复习Basic RNN2. LSTM 长短期记忆 网络结构3. RNN实现手写数字识别5. LSTM变形 强烈建议阅读:http://colah.github.io/posts/2015-08-Understanding-LSTMs/ Long range temporal depende 阅读全文
posted @ 2024-04-12 00:09 jack-chen666 阅读(6) 评论(0) 推荐(0) 编辑
摘要:目录1. 概述2. RNN的模型 参考:https://zhuanlan.zhihu.com/p/30844905 1. 概述 输出会反馈到输入的神经网络: 循环神经网络(Recurrent Neural Networks ,以下简称RNN),它广泛的用于自然语言处理中的语音识别,手写书别以及机器翻 阅读全文
posted @ 2024-04-11 11:49 jack-chen666 阅读(9) 评论(0) 推荐(0) 编辑
摘要:目录1. 引入2. Hierarchical Softmax3. 负样本negtive sample训练 参考链接:https://www.cnblogs.com/pinard/p/7243513.html 1. 引入 铺垫基础知识 霍夫曼树, 霍夫曼树的建立过程如下: 输入:权值为 输出:对应的霍 阅读全文
posted @ 2024-04-10 00:00 jack-chen666 阅读(22) 评论(0) 推荐(0) 编辑
摘要:目录1.统计语言模型2. N-gram3. NPLM神经语言模型4. Word2Vec--基础中的基础5. CBOW 模型6. Skip-gram 进入新的领域 加油! 1.统计语言模型 语言模型 本质就是让机器学会说话 但是机器本质上是只会1+1 统计语言模型是所有 NLP的基础,被广泛应用与语音 阅读全文
posted @ 2024-04-08 23:40 jack-chen666 阅读(32) 评论(0) 推荐(0) 编辑
摘要:目录1. 概述2.Triplets Loss3. 三元组样本选择 参考: 人脸识别网络 FaceNet facenet详解 1. 概述 FaceNet是谷歌于[CVPR2015.02](FaceNet: A Unified Embedding for Face Recognition and Clu 阅读全文
posted @ 2024-04-08 20:41 jack-chen666 阅读(346) 评论(0) 推荐(0) 编辑
摘要:目录 参考: 流形假设(Manifold Hypothesis) 在介绍 流形学习(Manifold learning) 之前,首先需要理解一个假设,就是流形假设(Manifold Hypothesis)。 这个假设认为,高维数据很多都是低维流形嵌入(embedding)于高维空间当中, 比如说三维 阅读全文
posted @ 2024-04-08 11:51 jack-chen666 阅读(99) 评论(0) 推荐(0) 编辑
摘要:目录1. 下载代码2. 安装环境的准备3. 代码修改4. mtcnn_detector 参考链接:人脸算法系列:MTCNN人脸检测详解 1. 下载代码 git clone https://github.com/YYuanAnyVision/mxnet_mtcnn_face_detection.git 阅读全文
posted @ 2024-04-03 14:25 jack-chen666 阅读(27) 评论(0) 推荐(0) 编辑
摘要:目录1. MT CNN-的原理2. 损失函数4. 升华 Paper地址: https://kpzhang93.github.io/MTCNN_face_detection_alignment/ github链接: https://github.com/kpzhang93/MTCNN_face_det 阅读全文
posted @ 2024-04-03 10:45 jack-chen666 阅读(64) 评论(0) 推荐(0) 编辑
摘要:目录 git clone https://github.com/matterport/Mask_RCNN.git 创建虚拟环境 python --version Python 3.7.5 安装依赖 requirements.txt pip3 install imgaug 安装 jupyter工具 j 阅读全文
posted @ 2024-04-02 16:41 jack-chen666 阅读(15) 评论(0) 推荐(0) 编辑
摘要:目录1. 总体网络结构2. Mask RCNN细节3. loss4. 预测 参考链接: https://blog.csdn.net/qq_47233366/article/details/131326554?ops_request_misc=%25257B%252522request%25255Fi 阅读全文
posted @ 2024-04-01 23:04 jack-chen666 阅读(25) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示