深度学习 - 随笔分类 - 孤飞

zero2Agent：面向大厂面试的 Agent 工程教程，从概念到生产的完整学习路线

摘要：2025 年下半年以来，AI Agent 工程师已经成为大厂最热门的岗位之一。蚂蚁 AI Coding、阿里 Agent 研发、字节 Infra Agent、腾讯 LLM 应用开发——几乎每一家头部公司都在疯狂招人。但现实是：会调 API 不等于会做 Agent，能跑 Demo 不等于能上生产。阅读全文

posted @ 2026-04-16 00:21 孤飞阅读(854) 评论(3) 推荐(4)

torch.nn基础学习教程 | PyTorch nn Basic Tutorial

摘要：> 基于`torch.nn`搭建神经网络的基础教程大纲： ## **1. 引言** 在我们开始深入探讨`torch.nn`之前，我们首先需要理解PyTorch及其神经网络库的基础知识。这一部分的内容将帮助你对PyTorch有一个整体的了解。 ### 1.1 **为什么选择PyTorch？** - * 阅读全文

posted @ 2023-08-28 23:56 孤飞阅读(2230) 评论(2) 推荐(6)

对doccano自动标注使用的默认UIE模型进行微调以提高特定领域的实体识别能力，提高标注速度

摘要：虽然doccano的自动标注使用默认的UIE模型可以识别出一定的实体，但是在特定领域或者因为实体类别名不能被理解很多实体是识别不了的，所以我们可以通过自己标注的数据对模型进行微调来满足我们Auto Labeing的需求。预处理doccano标注的数据该章节详细说明如何通过doccano.py脚本阅读全文

posted @ 2023-04-22 15:35 孤飞阅读(933) 评论(0) 推荐(1)

如何使用doccano+flask+花生壳+服务器实现命名实体识别ner自动标注

摘要：doccano安装与配置首先，本地安装教程有太多了，我就不详细写了。而且我本地也没成功run起来，但是想到标数据这种活怎么能一个人干呢？所以还是部署在服务器上比较好，添加几个用户之后访问服务器搭建的网站大家就可以一起愉（痛）快（苦）的标数据了，还可以比比谁标得快！正式开始：我们首先进入docc 阅读全文

posted @ 2023-04-19 16:11 孤飞阅读(681) 评论(0) 推荐(0)

从零开始配置深度学习环境：CUDA+Anaconda+Pytorch+TensorFlow

摘要：本文适用于电脑有GPU（显卡）的同学，没有的话直接安装cpu版是简单的。CUDA是系统调用GPU所必须的，所以教程从安装CUDA开始。可以配合视频教程食用：https://www.bilibili.com/video/BV12m4y1m7pq/?vd_source=06e4e8652ea90d79 阅读全文

posted @ 2023-04-14 16:45 孤飞阅读(3509) 评论(1) 推荐(1)

机器学习（一）：混淆矩阵与最优化方法习题（二元函数最小值梯度下降法手推＋代码实现）

摘要：机器学习第一次作业 1. 若样本的预测标签和真实标签如下：请给出Acc，Precision 和Recall [预测标签,真实标签] [ 1, 1], [ 1, 0], [ 1, 1], [ 0, 1], [ 1, 0], [ 1, 1], [ 0, 0], [ 1, 1], [ 1, 0], [ 0 阅读全文

posted @ 2023-03-01 14:16 孤飞阅读(476) 评论(0) 推荐(0)

LSTM模型可视化讲解

摘要：昨夜突然刷到一条讲解LSTM的推送，其中一张图让我彻底明白了LSTM的输入模式。下面放链接：可视化理解LSTM (qq.com) [LSTM模型结构的可视化 - 知乎 (zhihu.com)]( 阅读全文

posted @ 2022-11-18 13:46 孤飞阅读(387) 评论(0) 推荐(0)

神经网络与深度学习（五）：transformer

摘要：收藏两篇文章，就不自己写了：详解Transformer （Attention Is All You Need） - 知乎 (zhihu.com) Self-Attention和Transformer - machine-learning-notes (gitbook.io) 阅读全文

posted @ 2022-11-12 20:40 孤飞阅读(208) 评论(0) 推荐(0)

神经网络与深度学习（四）：注意力机制

摘要：发现已经有人总结了，难得复制了，直接贴链接：一文读懂注意力机制 - 知乎 (zhihu.com) 阅读全文

posted @ 2022-11-12 19:43 孤飞阅读(79) 评论(0) 推荐(0)

神经网络与深度学习（三）：循环神经网络网络

摘要：给神经网络增加记忆能力前馈神经网络：相邻两层之间存在单向连接，层内无连接有向无环图输入和输出的维数都是固定的，不能任意改变（全连接前馈网络)无法处理变长的序列数据可计算问题：时延神经网络：时延神经网络(Time Delay Neural Network,TDNN) 建立一个额外的延时阅读全文

posted @ 2022-11-09 11:24 孤飞阅读(334) 评论(0) 推荐(0)

神经网络与深度学习（二）：前馈神经网络

摘要：神经元激活函数的性质连续并可导（允许少数点上不可导）的非线性函数。可导的激活函数可以直接利用数值优化的方法来学习网络参数。激活函数及其导函数要尽可能的简单有利于提高网络计算效率。激活函数的导函数的值域要在一个合适的区间内不能太大也不能太小，否则会影响训练的效率和稳定性。单阅读全文

posted @ 2022-11-07 21:23 孤飞阅读(552) 评论(0) 推荐(0)

大数据关键技术：自然语言处理入门篇

摘要：分词与词向量自然语言处理简介自然语言处理概况什么是自然语言处理？自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算阅读全文

posted @ 2022-10-18 23:23 孤飞阅读(1376) 评论(0) 推荐(1)

RNN自学理解（一）

摘要：**RNN对具有序列特性的数据非常有效，它能挖掘数据中的时序信息以及语义信息，**利用了RNN的这种能力，使深度学习模型在解决语音识别、语言模型、机器翻译以及时序分析等NLP领域的问题时有所突破。参考文献1：史上最详细循环神经网络讲解（RNN/LSTM/GRU） - 知乎 (zhihu.com) 阅读全文

posted @ 2022-10-12 16:04 孤飞阅读(515) 评论(0) 推荐(0)

Upscayl，免费开源的 AI 图像增强软件

摘要：有的时候我们找遍了全网却难以找到一张模糊图片的原图，这时候我们想如果能够一键将图片变成高清的就好了。其实这正是计算机视觉的一大研究反向——图形增强，通过AI计算将模糊的图片增强，将几百kb的低像素图片变成数Mb的超清图片，今天我们就来分享一款免费开源的基于AI的图片增强软件——Upscayl。 Up 阅读全文

posted @ 2022-10-10 13:25 孤飞阅读(3707) 评论(0) 推荐(0)

文心ERNIE-ViLG，你的免费插图画师

摘要：你是否想拥有一个专属画师，免费为你的优美文字插上几幅优美的插图？如今已然实现最近AI作画确实很火，在DALL-E和Imagen崭露头角之后，ERNIE-ViLG、Stable-Diffusion（SD）、Disco-Diffusion相继开源开放，涌现出丰富多彩的AI作画作品。本次通过一个开源工具阅读全文

posted @ 2022-10-09 20:17 孤飞阅读(905) 评论(0) 推荐(1)

对循环神经网络参数的理解|LSTM RNN Input_size Batch Sequence

摘要：在很多博客和知乎中我看到了许多对于pytorch框架中RNN接口的一些解析，但都较为浅显甚至出现一些不准确的理解，在这里我想阐述下我对于pytorch中RNN接口的参数的理解。我们经常看到的RNN网络是如图下所示： RNN的 1. timestep训练过程这个左边图中间循环的箭头难以理解，所以将阅读全文

posted @ 2022-10-04 23:59 孤飞阅读(738) 评论(0) 推荐(0)

了解Pytorch|Get Started with PyTorch

摘要：一个开源的机器学习框架，加速了从研究原型到生产部署的路径。 !pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple import torch import numpy as np Basics 就像Tensorflow一样，我们也阅读全文

posted @ 2022-09-28 22:51 孤飞阅读(408) 评论(0) 推荐(1)

基于深度学习的文本分类案例：使用LSTM进行情绪分类

摘要：Sentiment classification using LSTM 在这个笔记本中，我们将使用LSTM架构在电影评论数据集上训练一个模型来预测评论的情绪。首先，让我们看看什么是LSTM？ LSTM，即长短时记忆，是一种序列神经网络架构，它利用其结构保留了对前一序列的记忆。第一个被引入的序列模型是阅读全文

posted @ 2022-09-23 21:03 孤飞阅读(894) 评论(0) 推荐(2)

NLP新手入门指南|北大-TANGENT

摘要：开源的学习资源：《NLP 新手入门指南》，项目作者为北京大学 TANGENT 实验室成员。该指南主要提供了 NLP 学习入门引导、常见任务的开发实现、各大技术教程与文献的相关推荐等内容，是一份非常全的适合新手小白初学入门的权威指南。值得mark! 以下正文：本教程供新加入 TANGENT 实验阅读全文

posted @ 2022-09-23 00:15 孤飞阅读(3119) 评论(0) 推荐(3)

交叉熵与对数似然分析

摘要：信息论(Information Theory) “信息”是指一组消息的集合。假设在一个噪声通道上发送消息，我们需要考虑如何对每一个信息进行编码、传输以及解码，使得接收者可以尽可能准确地重构出消息。信息论将信息的传递看作一种统计现象。信息传输信息压缩熵(Entropy) 在信息论中，熵用来衡阅读全文

posted @ 2022-08-13 19:11 孤飞阅读(224) 评论(0) 推荐(0)

孤飞-博客园

随笔分类 - 深度学习

公告