随笔分类 -  A---自然语言处理

摘要:机器学习 深度学习 python c++ 阅读全文
posted @ 2022-03-19 18:49 douzujun 阅读(111) 评论(0) 推荐(0) 编辑
摘要:https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247537696&idx=4&sn=4db4f54f831277c05e63b9c1df4ca75a&chksm=ebb76cf4dcc0e5e254f0b76fddcab79008837 阅读全文
posted @ 2021-07-08 11:06 douzujun 阅读(523) 评论(0) 推荐(0) 编辑
摘要:import spacy from tqdm import tqdm import numpy as np # In[8] def adj_dependcy_tree(argments, max_length=80): nlp = spacy.load('en') depend = [] depen 阅读全文
posted @ 2021-05-10 21:23 douzujun 阅读(476) 评论(0) 推荐(0) 编辑
摘要:47分钟 同时既是Encoder,也是Decoder,也是Seq2Seq(Encoder+Decoder) https://zhuanlan.zhihu.com/p/114746463 阅读全文
posted @ 2020-11-09 16:13 douzujun 阅读(577) 评论(0) 推荐(0) 编辑
摘要:笔记链接 阅读全文
posted @ 2020-09-23 21:05 douzujun 阅读(887) 评论(0) 推荐(0) 编辑
摘要:笔记摘抄 语料链接:https://pan.baidu.com/s/1wpP4t_GSyPAD6HTsIoGPZg 提取码:jqq8 数据格式如图: 导包: import os import sys import math from collections import Counter import 阅读全文
posted @ 2020-09-07 01:43 douzujun 阅读(1840) 评论(0) 推荐(1) 编辑
摘要:全部代码 已训练模型 1. 聊天机器人综合介绍 1.1 知识点 1.2 聊天机器人分类 1.21 从领域划分 固定领域(技术支持) 固定领域(天气查询) 开放领域(娱乐助手) 1.22 从模式划分 检索模式 应用: 简单原理: 生成模式 应用: 简单原理: 1.23 从功能划分 问答型聊天机器人 任 阅读全文
posted @ 2020-09-05 12:41 douzujun 阅读(4219) 评论(0) 推荐(4) 编辑
摘要:笔记摘抄 语料链接:https://pan.baidu.com/s/1YxGGYmeByuAlRdAVov_ZLg 提取码:tzao neg.txt和pos.txt各5000条酒店评论,每条评论一行。 1. 导包和设定超参数 import numpy as np import random impo 阅读全文
posted @ 2020-08-28 22:40 douzujun 阅读(4813) 评论(2) 推荐(1) 编辑
摘要:笔记摘抄 1. transformer资料 transformers(以前称为pytorch-transformers和pytorch-pretrained-bert) 提供用于自然语言理解(NLU)和自然语言生成(NLG)的BERT家族通用结构(BERT,GPT-2,RoBERTa,XLM,Dis 阅读全文
posted @ 2020-08-27 17:35 douzujun 阅读(20587) 评论(0) 推荐(5) 编辑
摘要:视频讲解 直接看这个-->Github 导包: import re import math import torch import numpy as np from random import * import torch.nn as nn import torch.optim as optim i 阅读全文
posted @ 2020-08-25 00:46 douzujun 阅读(2165) 评论(0) 推荐(0) 编辑
摘要:1. ELMO 2. BERT 就是Transformer的Encoder部分:输入input,输出embedding 如果处理中文,用 字 作为单位 (潮水--词,潮--字) 2.1 预测Masked word 2.2 [SEP] 和 [CLS] [SEP]:两个句子的 边界 [CLS]:输出 分 阅读全文
posted @ 2020-08-22 16:00 douzujun 阅读(391) 评论(0) 推荐(0) 编辑
摘要:https://www.cnblogs.com/linzhenyu/p/13277552.html 阅读全文
posted @ 2020-08-20 16:32 douzujun 阅读(472) 评论(0) 推荐(0) 编辑
摘要:摘抄 1. 爬取京东商品评论 JD.py import requests from urllib.parse import quote from urllib.parse import urlencode from lxml import etree import logging import js 阅读全文
posted @ 2020-08-19 22:33 douzujun 阅读(1911) 评论(2) 推荐(0) 编辑
摘要:笔记摘抄 Transformer模型(文本分类仅用到Encoder部分): 1. 数据预处理 和上一个博客https://www.cnblogs.com/douzujun/p/13511237.html中的数据和预处理都一致。 import numpy as np import torch from 阅读全文
posted @ 2020-08-17 21:06 douzujun 阅读(4438) 评论(3) 推荐(1) 编辑
摘要:摘抄笔记 语料链接:https://pan.baidu.com/s/1aDIp3Hxw-Xuxcx-lQ_0w9A 提取码:hpg7 train.txt pos/neg各500条,一共1000条(用于训练模型) dev.txt pos/neg各100条,一共200条(用于调参数) test.txt 阅读全文
posted @ 2020-08-16 00:46 douzujun 阅读(12539) 评论(5) 推荐(1) 编辑
摘要:1. 创建vocabulary 学习词向量的概念 用Skip-thought模型训练词向量 学习使用PyTorch dataset 和 dataloader 学习定义PyTorch模型 学习torch.nn中常见的Module Embedding 学习常见的PyTorch operations bm 阅读全文
posted @ 2020-08-03 22:16 douzujun 阅读(2512) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示