随笔分类 - A---自然语言处理
摘要:https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247537696&idx=4&sn=4db4f54f831277c05e63b9c1df4ca75a&chksm=ebb76cf4dcc0e5e254f0b76fddcab79008837
阅读全文
摘要:import spacy from tqdm import tqdm import numpy as np # In[8] def adj_dependcy_tree(argments, max_length=80): nlp = spacy.load('en') depend = [] depen
阅读全文
摘要:47分钟 同时既是Encoder,也是Decoder,也是Seq2Seq(Encoder+Decoder) https://zhuanlan.zhihu.com/p/114746463
阅读全文
摘要:笔记链接
阅读全文
摘要:笔记摘抄 语料链接:https://pan.baidu.com/s/1wpP4t_GSyPAD6HTsIoGPZg 提取码:jqq8 数据格式如图: 导包: import os import sys import math from collections import Counter import
阅读全文
摘要:全部代码 已训练模型 1. 聊天机器人综合介绍 1.1 知识点 1.2 聊天机器人分类 1.21 从领域划分 固定领域(技术支持) 固定领域(天气查询) 开放领域(娱乐助手) 1.22 从模式划分 检索模式 应用: 简单原理: 生成模式 应用: 简单原理: 1.23 从功能划分 问答型聊天机器人 任
阅读全文
摘要:笔记摘抄 语料链接:https://pan.baidu.com/s/1YxGGYmeByuAlRdAVov_ZLg 提取码:tzao neg.txt和pos.txt各5000条酒店评论,每条评论一行。 1. 导包和设定超参数 import numpy as np import random impo
阅读全文
摘要:笔记摘抄 1. transformer资料 transformers(以前称为pytorch-transformers和pytorch-pretrained-bert) 提供用于自然语言理解(NLU)和自然语言生成(NLG)的BERT家族通用结构(BERT,GPT-2,RoBERTa,XLM,Dis
阅读全文
摘要:视频讲解 直接看这个-->Github 导包: import re import math import torch import numpy as np from random import * import torch.nn as nn import torch.optim as optim i
阅读全文
摘要:1. ELMO 2. BERT 就是Transformer的Encoder部分:输入input,输出embedding 如果处理中文,用 字 作为单位 (潮水--词,潮--字) 2.1 预测Masked word 2.2 [SEP] 和 [CLS] [SEP]:两个句子的 边界 [CLS]:输出 分
阅读全文
摘要:https://www.cnblogs.com/linzhenyu/p/13277552.html
阅读全文
摘要:摘抄 1. 爬取京东商品评论 JD.py import requests from urllib.parse import quote from urllib.parse import urlencode from lxml import etree import logging import js
阅读全文
摘要:笔记摘抄 Transformer模型(文本分类仅用到Encoder部分): 1. 数据预处理 和上一个博客https://www.cnblogs.com/douzujun/p/13511237.html中的数据和预处理都一致。 import numpy as np import torch from
阅读全文
摘要:摘抄笔记 语料链接:https://pan.baidu.com/s/1aDIp3Hxw-Xuxcx-lQ_0w9A 提取码:hpg7 train.txt pos/neg各500条,一共1000条(用于训练模型) dev.txt pos/neg各100条,一共200条(用于调参数) test.txt
阅读全文
摘要:1. 创建vocabulary 学习词向量的概念 用Skip-thought模型训练词向量 学习使用PyTorch dataset 和 dataloader 学习定义PyTorch模型 学习torch.nn中常见的Module Embedding 学习常见的PyTorch operations bm
阅读全文